Byungchae Ryan Son

Sentetik Veri: Makineler Tüketici Oluyor

  • Yazım Dili: Korece
  • Baz Ülke: Tüm Ülkelercountry-flag
  • BT

Oluşturulma: 2024-05-10

Oluşturulma: 2024-05-10 14:06

"Yapay zeka ile üretilmiş tüketicilerle fikirlerinizi veya ürünlerinizi test edin ve güvenle karar verin."

Sentetik Veri: Makineler Tüketici Oluyor

Kullanıcı olmadan kullanıcı araştırması hizmeti sunan Sentetik kullanıcılar (Synthetic users)


Geçtiğimiz Şubat ayında ortaya çıkan Synthetic Users hizmeti, adından da anlaşılacağı üzere, ürün geliştirmeyle ilgili kullanıcı araştırmalarının konusunu gerçek insanlardan değil, üretilmiş sanal tüketicilerden sağlıyor. Sanal insanlara yönelik görüşme ve anketler yapılabilir, ürün kullanım deneyimiyle ilgili geri bildirimler alınabilir, uzun süredir birlikte olan Avrupa çiftleri gibi hedef kitlelerin özel durum ayarlama işlevi ve ilgili görüşme verilerinin 100'ü için 380 dolar gibi çığır açan bir maliyet tasarrufu sağlanabilir. Ayrıca, bu hizmeti kullanan etnografya, sosyoloji ve antropoloji uzmanlarının topluluklarında, rahatsız edici, endişe verici veya eğlenceli olmak üzere çeşitli tepkiler ortaya çıktı.


Bu, 'sentetik' yaratımlar değil, insanın kendisini anlama üzerine odaklanan nitel araştırmada, insanın öz kimliği, amacı, zevki ve değeriyle ilgili standartların tahmin edilenden daha kolay bir şekilde kopyalanıp anlaşılabilecek olması endişesini ve gerçek insanların gerçek hayatta karşılaştığı sorunların oluştuğu karmaşık toplumsal-politik durumların ve karşılıklı ilişki ağlarının yeterince temsil edilemeyeceği yönünde alaycı bakış açılarını içeriyor.


Aslında bu tür sentetik veriler yeni bir kavram değil. Sentetik veriler, veri kümelerinin elde edilmesinin zor olduğu durumlarda özellikle kullanışlıdır. Örneğin, otomobil üreticilerinin sanal araç simülasyonlarında sürücü davranışlarını taklit ederek, modelin çok çeşitli ve kapsamlı durumlarda eğitilmesini sağlamak veya 2,7 milyondan fazla COVID-19 hastasının kayıt verilerini kopyalayarak, istatistiksel özelliklerin aynı kalmasını sağlayan ancak tanımlayıcı bilgiler içermeyen bir veri kümesi oluşturmak ve böylece tüm dünyadaki araştırmacıların verileri hızla paylaşmasını ve araştırmalarını sürdürmesini sağlamak için kullanılmıştır.


Ancak, ChatGPT'nin neredeyse tüm hizmet alanlarında uygulanması ve hızla yayılmasıyla birlikte, zaten artmakta olan sentetik veri talebinin daha da patlayıcı bir şekilde artması ve kapsamının artık içgörü elde eden insanların günlük yaşamının bile sentetik verilerle değiştirilebileceği iddiasında bulunan hizmetlere kadar uzaması sağlanmıştır.


Özellikle Synthetic Users hizmeti, sentetik veri kullanımına ilişkin endişeleri en açık şekilde ortaya koyuyor,'gerçeklikle olan farkı', yani 'veri' ve 'gerçek' tanımlarının yeniden ele alınması gerektiğini gösteriyor.


Zaten yanlış bilgilerin hakim olduğu bir çağda yaşıyoruz ve gördüğümüz tüm verilerin kaynağını ve önyargılarını anlamak giderek zorlaşıyor. Önümüzdeki yıllarda ortaya çıkacak sentetik veri bolluğu, 'gerçek' ile 'yapay' arasındaki sınırı daha da belirsiz hale getirmekle kalmayacak, aynı zamanda sıradan veri tüketicilerinin orijinal verilerin kaynağını, toplanma ve manipülasyon yöntemlerini ve sonuç olarak ne kadar güvenilir olduklarını eleştirel olarak değerlendirmesini de zorlaştıracaktır.


Bu nedenle, sentetik veri devriminin istemediğimiz bir dünyayı yaratmasını önlemek için en önemli başlangıç noktası, büyük verilere değil, küçük verilere odaklanmak olmalıdır. Günümüzde birçok şirketin, önyargılı veya eksik veri kümeleri açıkça ortada olmasına rağmen, mevcut tüm verilere dayanarak karar vermeyi hedefleyen, 'veriye dayalı karar verme' olarak adlandırılan bir yaklaşıma odaklandığını görüyoruz. Bu nedenle, sentetik veriler, bulabileceğimiz en iyi gerçek verilerden türetilmelidir. Ayrıca, bu aşamada verilerde en önemli şeyin ne olduğu ve neden önemli olduğu konusunda derinlemesine bağlamsal bir anlayış ve mümkün olan en yüksek kalitede başlangıç veri kümesini sağlamak gerekir.


İnsanların söyledikleri ile yaptıkları arasındaki fark veya davranışlarımızın yaşam üzerinde öngörülemeyen etkileri gibi en son temel insan olguları hakkında katı bir anlayışa dayanmazsa, hem şirketlere hem de halka zarar verecek şekilde gerçeği tehdit eden bir sosyal dünya simülasyonu riski vardır.


Gelecekte sentetik veriler, günlük yaşantımızda çok daha büyük bir yer tutacak. Dünyayı deneyimleme şeklimizi şekillendiren algoritmalardan veri ve gerçeklik anlayışımıza kadar her şeyi yeniden yapılandırma potansiyeline sahip. Bu kadar önemli kararları, ne kadar iyi niyetli olurlarsa olsunlar, sadece bazı veri bilimcilerine bırakmak çok risklidir ve sosyal bilimler ve beşeri bilimler alanlarındaki uzmanlarla iş birliği gerektirmektedir. Bunun nedeni, sentetik verilerin mevcut bazı veri kümelerinden daha az yararlı veya daha kötü olması değil, aksine çok fazla olasılık sunabilmesinden kaynaklanan bir korkudur.



*Bu yazı, 11 Nisan 2023 tarihliElektronik Haberler İmzalı Yazar Yazısıyayınında yer alan içeriğin orijinalidir.


Referanslar


Yorumlar0