ChatGPT'nin ortaya çıkışından bu yana, yapay zeka patlaması iki yıl sürdü. Bu süre zarfında, genel halk, basit komutlardan akıcı ve doğal metinler üretebilen ve bilimkurgu senaryolarını gerçeğe dönüştürebilen büyük dil modellerinin yeteneklerinden heyecan duydu.
Büyük modeller alanı da yeni teknolojilerin gerçek ihtiyaçları karşılayan yeni ürünlere dönüştürülmesi ve yeni bir ticari ekosisteme dönüşmesi gereken kritik bir döneme giriyor.
Mobil ödemeler, akıllı telefonlar ve LTE'nin mobil internet çağının refahını artırması gibi, yapay zeka sektörü de 2024'te böyle bir ürün-pazar uyumu (PMF) arıyor.
Yeni teknolojilerin keşfedildiği çağ başladı ve yeni bir sınırın keşfedilip keşfedilemeyeceği, büyük modellerin sadece başka bir para yakma sermaye oyunu, internet balonunun tekrarı mı yoksa Jensen Huang'ın dediği gibi yeni bir endüstriyel devrimin başlangıcı mı olduğunu belirleyecek. Bu cevap, yapay genel zekadan (AGI) daha hızlı ortaya çıkacak.
Büyük Modellerle İlgili Büyük Sorunlar
Günümüzde, temel modellerdeki rekabet temelde sabitlendi. OpenAI liderliğinde, ChatGPT pazar liderliğini sağlam bir şekilde elinde tutarken, Anthropic, DeepMind, Llama ve Grok gibi diğer oyuncuların her birinin kendi güçlü yanları var.
Dolayısıyla 2024'te en heyecan verici şey, kimin parametrelerini genişlettiği veya tepki hızını iyileştirdiği değil, büyük model teknolojisinin ne kadar kullanılabilir bir ürün haline gelebileceği olacak.
Başından beri, büyük dil modeli teknolojisini uygulamak bir zorluktu. Harvard Business Review bir anket düzenledi ve 100'e kadar türde üretken AI uygulaması olduğunu buldu.
Ancak bunlar beş ana kategoriye ayrılıyor: teknik sorun çözme, içerik üretimi ve düzenleme, müşteri desteği, öğrenme ve eğitim, sanatsal yaratım ve araştırma.
Tanınmış yatırım firması a16z, Perplexity, Claude ve ChatGPT gibi bilindik isimler de dahil olmak üzere ekibinin en iyi üretken AI ürünlerini paylaştı. Granola, Wispr Flow, Every Inc. ve Cubby gibi not alma uygulamaları gibi daha niş ürünler de var. Eğitim sektöründe, 2024'ün en büyük kazananı Character.ai ve Replika gibi sohbet robotlarıyla birlikte NotebookLM oldu.
Sıradan kullanıcılar için bu ürünlerin çoğu ücretsizdir ve abonelik veya profesyonel sürümler gerekli masraflar değildir. ChatGPT gibi güçlü bir oyuncu için bile, 2024'teki abonelik geliri ayda yaklaşık 283 milyon dolardı ve 2023'e göre iki katına çıktı. Ancak büyük maliyetler karşısında bu gelir önemsiz görünüyor.
Teknolojik gelişmelerin tadını çıkarmak sıradan kullanıcılar için bir zevktir, ancak sektör profesyonelleri için, teknolojik evrim ne kadar heyecan verici olursa olsun, laboratuvarda kalamaz; test için ticari dünyaya girmelidir. Abonelik modeli yaygın olarak kabul görmemiştir ve reklam yerleştirme zamanı henüz gelmemiştir. Büyük modellerin para harcaması için kalan zaman tükeniyor.
Buna karşılık, iş odaklı kalkınma daha ümit vericidir.
2018'den beri, Fortune 500 kazanç çağrılarında AI'dan bahsedilmesi neredeyse iki katına çıktı. Tüm kazanç çağrılarında, kayıtların %19.7'si en çok tartışılan konu olarak jeneratif AI'dan bahsediyor.
Bu aynı zamanda tüm endüstrinin fikir birliğidir. Çin Bilgi ve İletişim Teknolojileri Akademisi tarafından yayınlanan “Yapay Zeka Gelişim Raporu (2024)” mavi kitabına göre, 2026 yılına kadar işletmelerin %80'inden fazlası üretken AI API'lerini kullanacak veya üretken uygulamalar dağıtacak.
İşletmelere ve tüketicilere yönelik uygulamalar farklı gelişim eğilimleri göstermektedir: Tüketiciye yönelik uygulamalar düşük engellere ve yaratıcılığa vurgu yaparken, işletmelere yönelik uygulamalar daha çok profesyonel özelleştirmeye ve verimlilik geri bildirimine odaklanmaktadır.
Başka bir deyişle, verimliliği artırmak her şirketin peşinde koştuğu ve başarmak istediği bir şeydir, ancak sadece bu dört kelimeyi söylemek çok belirsizdir. Büyük modellerin kullanım durumlarındaki sorunları gerçekten çözebileceklerini ve verimliliği gerçekten artırabileceklerini kanıtlamaları gerekir.
Teknolojiyi Uygulamak İçin Giriş Noktalarını Kesin Olarak Bulma
Kaynak yatırımı veya pazar genişletme çabaları açısından, Çin'in büyük modellerdeki rekabeti 2024 boyunca yoğun geçti.
Çin Sanayi ve Bilgi Teknolojileri Bakanlığı'nın verilerine göre, Çin'in büyük dil modeli pazarının 2023'teki büyüme oranı %100'ü aşarak yaklaşık 2 milyar dolara ulaştı. Şirketler ticarileştirmeyi aktif olarak deniyor, başlangıçta fiyat savaşlarına giriyor: jeton tabanlı faturalama, API çağrıları ve diğer yöntemlerle maliyetleri düşürüyorlar. Birçok ana akım büyük model artık neredeyse ücretsiz.
Fiyatları ve maliyetleri düşürmek nispeten kolaydır. Ancak, işletmeyi anlamak ve giriş senaryolarını analiz etmek daha zorlu bir yoldur.
Tüm şirketler düşük maliyetli rekabete güvenerek fiyat savaşlarına katılmıyor.
"Bu durumda, benzersiz özelliklerimizi bulmak ve güçlü yönlerimizden yararlanmak daha önemli. Tencent, bize daha fazla içgörü sağlayan ve yeteneklerimizi daha da geliştiren birçok dahili senaryoya sahip," diyor Tencent Cloud'da Yapay Zeka Ürün Uzmanı ve Tencent Hunyuan ToB Ürünleri Başkanı Zhao Xinyu. "Dışarıda, bir sektöre odaklanıyoruz, o sektör içindeki belirli senaryolara yoğunlaşıyoruz ve sonra kademeli olarak genişliyoruz."
Birçok temel model arasında Hunyuan en dikkat çekici olanı olmayabilir, ancak teknik gücü yadsınamaz.
Eylül 2023'te Hunyuan, yeni bir Uzman Karışımı (MoE) yapısı benimseyerek genel metinden metne model Hunyuan Turbo'yu yayınladı. Dil anlama ve oluşturma, mantıksal akıl yürütme, niyet tanıma ve kodlama, uzun bağlam ve toplama görevlerinde iyi performans gösterdi. Kasım 2023'teki dinamik güncelleme sürümünde, genel olarak en iyi performans gösteren modele yükseltildi. Şu anda, Tencent Hunyuan'ın yetenekleri, model uygulamalarının senaryolara yerleşmesine yardımcı olmak için Tencent Cloud Intelligence'ın diğer AI ürünleri ve yetenekleriyle birleştirilmiş çeşitli boyutlarda ve türlerde modeller sunan Tencent Cloud aracılığıyla tamamen sunuluyor.
Şu anda, modellerin uygulama biçimleri kabaca iki türe ayrılır: ciddi senaryolar ve eğlence senaryoları. İkincisi, sohbet robotları, eşlik eden uygulamalar vb. içerir.
"Ciddi senaryolar", doğruluk ve güvenilirliğin çok talep edildiği kuruluşların temel iş operasyonlarındaki uygulamaları ifade eder. Bu senaryolarda, büyük modellerin genellikle önceden belirlenmiş iş süreçlerini ve kalite standartlarını takip ederek yapılandırılmış bilgileri işlemesi gerekir ve uygulama etkileri doğrudan kuruluşların operasyonel verimliliği ve iş sonuçlarıyla ilgilidir.
Tencent Cloud bir zamanlar bir giden hizmet sağlayıcısının tipik ciddi bir senaryo olan bir müşteri hizmetleri sistemi kurmasına yardımcı oldu. Giden aramalar, büyük dil modelleriyle oldukça uyumlu olan doğal dil diyalog yetenekleri, içerik anlama ve analiz yeteneklerini içerir.
Aslında zorluk detaylarda yatıyor. O zamanlar, ekip iki temel zorlukla karşı karşıyaydı. Birincisi performans sorunlarıydı, modelin parametre boyutu çok büyüktü, 70B veya 300B ölçeğine ulaşıyordu, yanıtın 500 milisaniye içinde nasıl tamamlanacağı ve alt akış TTS sistemine nasıl geçirileceği önemli bir teknik zorluk haline geldi.
İkincisi, diyalog mantığının doğruluğuydu. Model bazen bazı diyaloglarda mantıksız yanıtlar üretiyordu ve bu da genel diyalog etkisini etkiliyordu. Bu zorlukların üstesinden gelmek için proje ekibi, 1-2 aylık bir geliştirme döngüsü içinde haftada bir sürümlük hızlı bir yineleme hızını koruyarak yoğun bir yineleme stratejisi benimsedi.
Kurumsal müşteriler büyük dil modeli teknolojisine ilgi gösterir ve yenilikleri denemeye isteklidir, ancak teknoloji ve işletmenin derin entegrasyonunda her zaman bilişsel bir boşluk vardır. Bu, işletmelerin kendi işlerini anlamamasından kaynaklanmaz, ancak endüstri sorunlarını ve iş senaryolarını derinlemesine anlayacak, en uygun senaryoları bulacak, işletmeler için AI iniş çözümleri tasarlayacak ve teknoloji ile işletmenin en iyi kombinasyonunu elde edecek profesyonel bir teknik ekip gerektirir.
Xinyu, "Geleneksel yaklaşım operatörlerin bir seferde bir senaryo (corpora) oluşturmasını gerektirebilir," diye açıkladı, "ancak büyük modellerde, talebi karşılamak için yalnızca bir komut vermeniz gerekir." Talebi netleştirdikten sonra, Hunyuan ekibi neredeyse her hafta bir sürümü güncelleyerek yineleme hızını artırdı ve bir veya iki ay içinde doğruluk %95'e ulaştı.
Bu giden hizmet sağlayıcısı için, üretken teknoloji tamamen yeniydi. Hunyuan, büyük modellerin getirdiği faydaları doğrudan onlara gösterdi ve işgücü giderlerini dörtte üç oranında azalttı.
Xinyu, "En iyi yaklaşım etkileri sergilemektir" dedi. Müşteriler üretken teknoloji hakkında biraz anlayışa sahip olduğunda ancak çok fazla anlayışa sahip olmadığında, etkileri sergilemek en etkili yoldur. Müşterinin iş deneyimi aracılığıyla girilebilen senaryolar bularak, doğrudan test doğrulaması yaparak ve elde edilebilecek iyileştirmeleri göstererek.
Benzer bir deneyim, "çift yönlü bir yolculuk" olarak tanımlanan Xiaomi ile iş birliğinde de yaşandı.
Diğer taraf, büyük modelleri Q&A etkileşimlerine dahil etmek ve AI arama yeteneklerini terminallere uygulamak istiyordu. Bu, Hunyuan'ın iki güçlü yönüne denk geldi: Tencent'in zengin içerik ekosisteminin sağladığı destek ve Hunyuan'ın AI aramasındaki yetenekleri. Q&A için doğruluk çok kritiktir.
“Başlangıçta hala birçok zorluk vardı,” diye hatırlıyor Xinyu. “Onların bakış açısına göre, iş formu gündelik sohbet, bilgi soru-cevap ve diğer türler dahil olmak üzere birden fazla senaryoyu kapsıyordu, bunların arasında bilgi soru-cevap senaryosunun nispeten yüksek doğruluk gereksinimleri vardı.”
Hunyuan ekibi, ön testler yoluyla arama senaryolarındaki avantajlarını netleştirdi ve diğer tarafla birlikte, farklı konu seviyelerine göre geniş olarak tanımlanmış Soru & Cevap etkileşimini kademeli olarak geliştirdi. Bu tür bir segmentasyon, modelin her senaryonun özel ihtiyaçlarını ve etki gereksinimlerini daha net bir şekilde anlamasını sağlayarak daha hedefli optimizasyon gerçekleştirmesini sağlar.
Bilgi Soru-Cevap senaryosu iniş noktası oldu. Sonraki uygulamalarda, Hunyuan'ın hala üstesinden gelmesi gereken birçok zorluk vardı: gecikme sorunlarından bahsetmeye gerek yok, yanıt süresi hızlı olmalı; ikinci olarak, arama içeriğinin entegrasyonu.
"Tüm bağlantıda, yüksek zamanlı bir soru olup olmadığını belirlemek için kendi geliştirdiğimiz bir arama motoru ve bir niyet sınıflandırma modeli oluşturduk. Örneğin, haberlerle veya güncel olaylarla ilgili olup olmadığını ve ardından ana modele mi yoksa AI aramasına mı verileceğine karar verdik."
Yalnızca en çok ihtiyaç duyulan parçaları aramak yanıt hızını büyük ölçüde artırır. Önemli bir keşif, sorguların %70'inin AI aramasına yönlendirilmesidir, bu da en temel çağrı desteği olarak yeterince zengin içerik olması gerektiği anlamına gelir.
Hunyuan'ın arkasında tüm Tencent içerik ekosistemi yer alır. Haberlerden, müzikten, finans ve hatta sağlık hizmetlerine kadar, Tencent'in ekosistemi çok sayıda yüksek kaliteli içerik sunar. Bu içerik, aramalar sırasında Hunyuan modeli tarafından erişilebilir ve referans alınabilirdir ve bu da benzersiz bir avantaj sağlar.
İki aydan fazla süren yoğun çalışmaların ardından, yanıt kalitesi, yanıt hızı ve performans gereksinimleri tamamen karşıladı ve Xiaomi'nin gerçek iş operasyonlarına uygulandı.
B2B işinin anahtarı gelir elde etmek ve güven kazanmaktır; bu da müşterilerin operasyonlarına gerçek değer katmayı gerektirir.
Daha Fazla Senaryoya Ulaşmak İçin Genellemeyi "Yuvarla"
Büyük modellerin çeşitli endüstrilerde ve ürünlerde uygulanması aynı zamanda teknolojinin büyümesini de teşvik ediyor.
Bazı büyük model ürünler için, B2C yolunu seçmek temel bir hususu içerir: modeli optimize etmek için tüketici geri bildirimlerini kullanmak. Büyük modelleri ayarlama ihtiyacı sonsuzdur ve tüketici kullanıcılarının sayısı ve etkinliği model yinelemesi için yakıt sağlar, böylece yineleme hızını hızlandırır.
Aslında B2B işinde de bu durum gerçekleşiyor, talepler daha da artıyor.
“Teenager Gains”in K12 Çince makale notlandırma özelliği Hunyuan'ın çok modlu yeteneklerini kullanır. Tencent Cloud'un akıllı OCR teknolojisiyle birleştiğinde, öğrencilerin makale içeriklerini tanır ve makaleleri önceden belirlenmiş puanlama standartlarına göre notlandırmak için büyük modeli kullanır.
Genellikle, büyük model ile insan öğretmen arasındaki puan farkı beş puan içindeyse, bu iyi olarak kabul edilir—ancak buna ulaşmak kolay değildir. Başlangıçta, Hunyuan'ın puanlarının yalnızca %80'i insan öğretmenlerin puanlarının beş puan içindeydi.
"Model, bazı senaryolarda sorunları çözmek için belirli yöntemlere ve yeteneklere sahip. Ancak, belirli bir müşterinin işine odaklanıldığında daha yüksek performans gerekiyor," dedi Xinyu. "%90 doğruluk iş hedeflerini karşılayabilirken, %70 veya %80'de hala bir boşluk var."
Bu, sürekli çaba gerektiği anlamına gelir. Kurumsal müşteri tabanı genişledikçe, teknolojinin kendisine yeni talepler yüklenir: ilk olarak, yineleme hızında önemli bir artış - tüketici kullanıcıları için yinelemeler bir ila iki ay sürebilir, ancak artık her hafta yeni bir sürüm ortaya çıkabilir. Bu yüksek frekanslı yineleme, model büyümesini ve ilerlemesini büyük ölçüde destekler.
İkinci olarak, sürekli olarak farklı kurumsal senaryolara hizmet etmek, modelin genelleme yeteneğini önemli ölçüde artırmıştır. Bu, çeşitli kurumsal ihtiyaçlara derinlemesine hizmet etmenin yalnızca model geliştirme ve yineleme hızını artırmakla kalmayıp aynı zamanda modelin pratikliğini ve uyarlanabilirliğini de geliştirerek ciddi senaryolardan daha eğlence odaklı olanlara genişlemesine olanak sağladığını göstermektedir.
Son zamanlarda A Serisi finansmanında on milyonlarca dolar elde eden rol yapma içerik platformu “Dream Dimension”, genç kullanıcılara hizmet etmeyi amaçlayan Hunyuan büyük modelinin rol yapma özel modeli Hunyuan-role'u uyguladı. Etkileşimli, hikaye odaklı sanal karakter etkileşimi deneyimi sağlamak için üretken AI teknolojisini birleştiriyor.
Hunyuan-role, insan-bilgisayar etkileşiminin yeni bir biçimine öncülük etti. Çeşitli sanal karakter görüntüleri oluşturarak ve önceden ayarlanmış hikaye arka planları ve karakter ayarlarına dayanarak, kullanıcıları doğal ve akıcı etkileşimli diyaloglara dahil eder.
Teknik düzeyde, bu tür senaryo uygulamaları Hunyuan-rol'ün uzun ve kısa metin diyaloglarını, niyet tanımayı ve tepkiyi ele almada lider avantajlarını göstermiştir. Çeşitli uygulama senaryolarını ele alabilir ve mükemmel içerik insanlaştırma yetenekleri sergiler; yalnızca sıcak diyalog etkileşimlerine katılmakla kalmaz, aynı zamanda sürükleyici bir kullanıcı deneyimi yaratmak için hikayeleri ilerletir.
Bu özellikler Hunyuan-rolünü ürün müşteri edinimi ve kullanıcı operasyonları için güçlü bir araç haline getirir ve kullanıcı tutma ve katılımını artırmada önemli bir rol oynar. Ayrıca, ciddi senaryolarda geliştirilen ve iyileştirilen Hunyuan'ın, uç taraf uygulamalarında bile daha geniş senaryoları kapsayabilen genelleme yetenekleri geliştirdiğini yansıtır.
Ciddi senaryolardan eğlenceye, yaratıcılığa ve daha fazlasına doğru genişlemek, büyük model uygulamalarının üstlenmesi gereken bir yolculuktur.
Teknoloji olgunlaştıkça ve maliyetler azaldıkça, büyük modeller daha geniş uygulama senaryolarına doğru genişlemeye mahkumdur. Başlangıçta kurumsal ofis çalışmaları, veri analizi ve bilimsel araştırma gibi ciddi iş senaryolarına odaklanan bu alanların net talepleri ve daha yüksek ödeme isteği vardır.
Eğlence, yaratıcılık ve içerik üretimine doğru daha fazla genişlemek stratejik bir dayanak gerektirir: her zaman temel hedef olarak belirli senaryo ihtiyaçlarını çözmeye odaklanmak, büyük model yeteneklerini entegre etmek için giriş noktasını belirlemek.
Uygulama yazılımlarıyla işbirliği yapmanın yanı sıra, modelin tüketiciye dönük uçta performans göstermesini ve işlev görmesini sağlamak, kullanıcıların günlük yaşamlarına daha yakın hizmetler sunmak ve daha rahat, anında servis deneyimleri sunmak için donanım üreticileriyle de ortaklıklara ihtiyaç duyulmaktadır.
Bu süreçte, pazar farkındalığı ve üretken AI teknolojisinin kabulü sürekli olarak artıyor ve kullanıcı tabanı istikrarlı bir şekilde genişliyor. Bu hızla değişen pazar ortamı karşısında, modelin yineleme yeteneği özellikle önemli hale geliyor. Bu yalnızca teknik performansa değil, aynı zamanda kullanıcı ihtiyaçlarını anlama, farklı senaryolara uyum sağlama ve daha fazlasına da yansıyor. Yalnızca hızlı öğrenebilen, sürekli olarak optimize edebilen ve sürekli olarak yeni taleplere uyum sağlayabilen modeller ve ekipler rekabette avantaj sağlayabilir.
Daha fazla senaryo sürekli olarak ele alındıkça, daha fazla son tüketiciye erişim de genişler. Piyasanın genel olarak üretken teknolojiyi kabul etmesiyle, potansiyel kullanıcı tabanı büyümeye devam edecektir. Hızlı bir şekilde yineleyebilen ve kendini geliştirebilen bir model, değişikliklere daha kararlı ve daha ileriye doğru hareket ederek hevesle uyum sağlayabilir.
Kaynaktan ifan
Yasal Uyarı: Yukarıda belirtilen bilgiler Alibaba.com'dan bağımsız olarak ifanr.com tarafından sağlanmaktadır. Alibaba.com, satıcının ve ürünlerin kalitesi ve güvenilirliği konusunda hiçbir beyan ve garanti vermez. Alibaba.com, içeriğin telif hakkıyla ilgili ihlallere ilişkin her türlü sorumluluğu açıkça reddeder.