Đây là bài viết được dịch bởi AI.
Dữ liệu tổng hợp: Máy móc trở thành người tiêu dùng
- Ngôn ngữ viết: Tiếng Hàn Quốc
- •
- Quốc gia cơ sở: Tất cả các quốc gia
- •
- CNTT
Chọn ngôn ngữ
Văn bản được tóm tắt bởi AI durumis
- Dịch vụ Người dùng Tổng hợp được ra mắt vào tháng 2 vừa qua là một dịch vụ nghiên cứu người dùng sử dụng người tiêu dùng ảo, mang lại hiệu quả tiết kiệm chi phí so với nghiên cứu nhắm mục tiêu vào con người thực, nhưng nó cũng làm dấy lên lo ngại rằng dịch vụ này có thể không phản ánh đúng bản chất, giá trị của con người.
- Dữ liệu tổng hợp được sử dụng trong nhiều lĩnh vực, chẳng hạn như mô phỏng ô tô, dữ liệu hồ sơ bệnh nhân COVID-19, và nhu cầu đối với dữ liệu tổng hợp đang tăng lên một cách bùng nổ, đặc biệt là sau sự xuất hiện của ChatGPT.
- Để đảm bảo rằng cuộc cách mạng dữ liệu tổng hợp không ảnh hưởng tiêu cực đến xã hội của chúng ta, chúng ta cần tạo ra dữ liệu tổng hợp dựa trên dữ liệu thực tế, hiểu sâu sắc ngữ cảnh và hợp tác với các chuyên gia trong lĩnh vực khoa học xã hội và nhân văn.
"Sử dụng người tiêu dùng tổng hợp AI để thử nghiệm ý tưởng hoặc sản phẩm và đưa ra quyết định một cách tự tin."
Synthetic users cung cấp dịch vụ nghiên cứu người dùng mà không có người dùng
Dịch vụ Người dùng Tổng hợp ra mắt vào tháng 2 năm ngoái, đúng như tên gọi, cung cấp đối tượng cho nghiên cứu người dùng liên quan đến phát triển sản phẩm không phải là con người thực mà là người tiêu dùng ảo được tạo ra. Có thể tiến hành phỏng vấn và khảo sát đối với những người ảo, cũng có thể nhận được phản hồi liên quan đến trải nghiệm sử dụng sản phẩm. Ngoài ra, dịch vụ này còn cung cấp chức năng thiết lập tình huống cụ thể của khách hàng mục tiêu như cặp đôi ở châu Âu yêu nhau lâu năm, dữ liệu phỏng vấn liên quan 100 trường hợp với giá 380 USD, hiệu quả tiết kiệm chi phí đột phá. Và cộng đồng những người theo học dân tộc học, xã hội học, nhân loại học khi tiếp xúc với dịch vụ này đã đưa ra nhiều phản ứng khác nhau, từ khó chịu, cảm thấy nguy hiểm đến vui nhộn.
Điều này bao gồm sự lo lắng rằng tiêu chuẩn về bản sắc, mục đích, niềm vui và giá trị bản chất của con người trong nghiên cứu định tính, không phải là tác phẩm "tổng hợp" mà là công việc hiểu chính con người, có thể dễ dàng sao chép và hiểu được. Và cái nhìn bi quan rằng dịch vụ này không thể hiện đầy đủ những tình huống chính trị xã hội phức tạp mà những người thực sự gặp phải trong cuộc sống, cũng như những mối quan hệ cùng có lợi được hình thành.
Thực tế, dữ liệu tổng hợp không phải là một khái niệm mới. Dữ liệu tổng hợp đặc biệt hữu ích khi tập hợp dữ liệu gặp khó khăn, ví dụ trong mô phỏng xe hơi ảo của các nhà sản xuất ô tô, nó được sử dụng để mô phỏng hành vi lái xe và đào tạo mô hình trong nhiều tình huống khác nhau. Hoặc sao chép hồ sơ của hơn 2,7 triệu bệnh nhân COVID-19, tạo ra bộ dữ liệu có cùng đặc điểm thống kê nhưng không có thông tin nhận dạng, cho phép các nhà nghiên cứu trên toàn cầu chia sẻ và nghiên cứu nhanh chóng.
Tuy nhiên, trong bối cảnh hiện tại, khi ChatGPT được áp dụng vào hầu hết các dịch vụ trong mọi lĩnh vực và lan rộng nhanh chóng, đã tạo điều kiện cho nhu cầu về dữ liệu tổng hợp vốn đã tăng vọt bùng nổ hơn nữa, phạm vi của nó giờ đây đã mở rộng đến mức dịch vụ khẳng định rằng cuộc sống thường ngày của con người tìm kiếm thông tin cũng có thể được thay thế bằng dữ liệu tổng hợp.
Đặc biệt, dịch vụ Người dùng Tổng hợp rõ ràng nhất là nỗi lo ngại về việc sử dụng dữ liệu tổng hợp, đó là sự “chênh lệch với thực tế”, nghĩa là cần phải xác định lại định nghĩa về “dữ liệu” và “sự thật”.
Chúng ta đã sống trong thời đại của thông tin sai lệch, việc hiểu nguồn gốc và định kiến của mọi dữ liệu mà chúng ta nhìn thấy ngày càng trở nên khó khăn hơn. Làn sóng dữ liệu tổng hợp sắp đổ bộ sẽ không chỉ làm mờ ranh giới giữa "thực tế" và "nhân tạo", mà còn khiến người tiêu dùng dữ liệu thông thường càng khó đánh giá một cách phê phán nguồn gốc, cách thu thập và thao tác dữ liệu gốc, và kết quả là phải tin tưởng đến mức độ nào.
Do đó, để cuộc cách mạng dữ liệu tổng hợp không tạo ra thế giới mà chúng ta không mong muốn, điều quan trọng nhất cần bắt đầu là chú ý đến việc dữ liệu nhỏ, không phải dữ liệu lớn. Ngày nay, nhiều doanh nghiệp có xu hướng tập trung vào việc đưa ra quyết định dựa trên dữ liệu, được gọi là “quyết định dựa trên dữ liệu”, mặc dù bộ dữ liệu bị sai lệch hoặc không đầy đủ là điều rõ ràng. Do đó, dữ liệu tổng hợp phải xuất phát từ những dữ liệu thực tế tốt nhất mà chúng ta có thể tìm thấy. Đồng thời, cần phải cung cấp bộ dữ liệu ban đầu chất lượng tốt nhất có thể, cùng với sự hiểu biết sâu sắc về bối cảnh về điều gì là quan trọng nhất trong dữ liệu và lý do tại sao nó quan trọng.
Bởi vì nếu không dựa trên sự hiểu biết nghiêm ngặt về những hiện tượng cơ bản nhất của con người gần đây nhất, chẳng hạn như sự khác biệt giữa những gì mọi người nói và làm, hoặc tác động không ngờ của cuộc sống đối với hành động của chúng ta, chúng ta sẽ có nguy cơ mô phỏng một thế giới xã hội đe dọa thực tế theo cách gây hại cho cả doanh nghiệp và công dân.
Trong tương lai, dữ liệu tổng hợp sẽ chiếm một phần lớn hơn trong cuộc sống hàng ngày của chúng ta. Nó có tiềm năng tái cấu trúc mọi thứ, từ các thuật toán tạo nên trải nghiệm của chúng ta về thế giới đến sự hiểu biết của chúng ta về dữ liệu và thực tế. Giao phó những quyết định quan trọng này cho một số nhà khoa học dữ liệu, dù với ý định tốt đến đâu, cũng là một rủi ro quá lớn. Cần phải hợp tác với các chuyên gia trong lĩnh vực khoa học xã hội và nhân văn. Điều này không phải đơn thuần vì dữ liệu tổng hợp không hữu ích hơn hoặc tệ hơn so với một số bộ dữ liệu hiện tại, mà là vì nó có thể tạo ra quá nhiều khả năng, tạo ra sự sợ hãi.
*Bài viết này là bản gốc được đăng trên Cột mốc có tên trên báo điện tửvào ngày 11 tháng 4 năm 2023.
Tài liệu tham khảo