Google Gemini: Yeni Üretken Yapay Zeka Platformu

Google Gemini: Yeni Üretken Yapay Zeka Platformu

Yeni bir üretken yapay zeka platformu olan Gemini'nin lansmanıyla birlikte, Google kargaşa yaratmaya çalışıyor. İkizler burcuAncak bazı alanlarda umut verici görünse de bazı alanlarda eksiklikler var. Peki İkizler burcu tam olarak nedir? Hangi açıdan faydalıdır? Ayrıca rekabetle karşılaştırıldığında nasıldır?

En yeni Gemini gelişmelerinden haberdar olmayı kolaylaştırmak için bu yararlı kılavuzu hazırladık. Yeni Gemini modelleri ve özellikleri mevcut oldukça güncellenecektir.

İkizler nedir?

Google'ın Gemini adı verilen yeni nesil üretken yapay zeka modelleri bir süredir üzerinde çalışılıyor. DeepMind ve Google Research, Google'ın yapay zeka araştırma bölümleridir. Üç tip mevcuttur:

  • Gemini Ultra, Gemini'nin amiral gemisi modelleri
  • Gemini Pro, bir “lite” Gemini modeli
  • Gemini Nano, Pixel 8 Process gibi akıllı telefonlarda çalışan daha kompakt ve "damıtılmış" bir model

Her Gemini modeli şu şekilde eğitildi: “doğal olarak multimodal” veya metin dışındaki medyayı kullanma ve bunlarla etkileşim kurma becerisine sahip. Ön eğitim ve ince ayar için çok çeşitli müzik, resim, video, kod tabanı ve çeşitli dillerdeki metinler kullanıldı.

Bu, Gemini'yi Google'ın kendi devasa dil modeli gibi modellerden farklılaştırıyor LaMDA, yalnızca metin verileriyle eğitildi. LaMDA metin dışında herhangi bir şeyi (örneğin makaleler, e-posta taslakları vb.) yorumlayamaz veya oluşturamaz; Gemini modelleri ise bunu yapabilir. Görselleri, sesleri ve diğer şekilleri kavrama kapasiteleri sınırlıdır ancak hiç yoktan iyidir.

Bard ve İkizler Arasındaki Fark Nedir?

Google, Gemini'nin Gemini'den farklı ve farklı olduğunu en başından beri açıkça ortaya koymakta başarısız olarak markalaşma becerilerinden yoksun olduğunu bir kez daha gösterdi. ozan. Bard yalnızca belirli Gemini modellerine erişim sağlayan bir arayüzdür; bunu Gemini ve diğer nesil yapay zeka modelleri için bir uygulama veya istemci olarak düşünün. Bunun aksine Gemini, bir uygulama veya ön uçtan ziyade bir model ailesidir. Yalnız bir İkizler deneyimi yoktur ve büyük ihtimalle hiçbir zaman da olmayacaktır. Bunu OpenAI ürünleriyle karşılaştırırsanız Bard şunu ifade eder: ChatGPTŞirketin popüler konuşma yapay zeka aracı olan Gemini, onu destekleyen dil modelini ifade ediyor; ChatGPT durumunda bu, GPT-3.5 veya 4'tür.

Ayrıca Gemini, şirketin daha geniş yapay zeka planına uyabilecek veya uymayabilecek bir metinden resme modeli olan Imagen-2'den tamamen bağımsızdır. Merak etme; kafa karışıklığında yalnız değilsin!

İkizler burcu ne yapabilir?

Gemini modelleri çok modlu olduğundan teorik olarak ses transkripsiyonu, resim ve video altyazıları ve sanat eserleri oluşturma gibi çeşitli görevleri yerine getirebilirler. Bu özelliklerden çok azı henüz ürün olarak piyasaya sürülmedi (bu konuya daha sonra değineceğiz), ancak Google bunların hepsinin ve daha fazlasının kısa süre içinde kullanıma sunulacağının sözünü veriyor.

Elbette firmanın iddialarına inanmak zor.

Google, Bard'ın ilk lansmanında oldukça düşük performans gösterdi. Yakın zamanda, Gemini'nin yeteneklerini gösterdiğini iddia eden, kapsamlı bir şekilde üzerinde oynanmış ve az ya da çok istek uyandıran bir filmle kaşları karıştırdı. Gemini, teknoloji devinin takdirine göre, sınırlı kapasitede de olsa bugün bir şekilde mevcut.

Yine de, eğer Google iddialarında aşağı yukarı doğruysa, Gemini modellerinin çeşitli katmanlarının piyasaya sürüldükten sonra gerçekleştirebilecekleri şeyler şunlardır:

İkizler Ultra

Yani henüz sadece bir “kümeyi seç” Bir avuç Google ürünü ve hizmetinden yararlanan tüketicilerin oranı Gemini Ultra'ya erişim sağladı. "Yapı temeli" geri kalanın etrafında inşa edildiği model. Bu, Google'ın en büyük modelinin bu yılın sonuna kadar daha özgürce piyasaya sürülmesine kadar değişmeyecek. Ultra ile ilgili bilgilerin çoğu Google liderliğindeki ürün demolarından geliyor, bu yüzden buna biraz ihtiyatlı yaklaşın.

Google'a göre Gemini Ultra, fizik ödevlerine yardımcı olmak, sorunları bir çalışma sayfasında adım adım yanıtlamak ve daha önce doldurulmuş çözümlerdeki olası hataları belirtmek için kullanılabilir. Gemini Ultra ayrıca belirli bir konuyla ilgili bilimsel yayınların bulunması, bu makalelerden bilgi çıkarılması ve “güncelleniyor” Grafiği daha yeni verilerle yeniden oluşturmak için gereken formülleri oluşturarak bir grafik.

Daha önce de belirtildiği gibi Gemini Ultra, resim oluşturmaya izin veriyor. Ancak Google, model piyasaya sürüldüğünde kapasitenin ürünleştirilmiş sürümüne dahil edilmeyeceğini söylüyor; bunun nedeni belki de yöntemin ChatGPT gibi uygulamaların fotoğraf üretme şeklinden daha karmaşık olmasıdır. Gemini, önerileri bir resim oluşturucuya beslemek yerine (DALL-E 3'ün ChatGPT'de yaptığı gibi) grafikler üretir “doğal olarak” herhangi bir ara adım olmadan.

İkizler Uzmanı

Gemini Pro, Gemini Ultra'dan farklı olarak bugün genel kullanıma açıktır. Ancak, kullanıldığı yere bağlı olarak değiştiği için yetenekleri belirsizdir.

Google, Gemini Pro'nun başlangıçta salt metin biçiminde piyasaya sürüldüğü Bard'da modelin düşünme, planlama ve kavrama açısından LaMDA'dan daha iyi performans gösterdiğini iddia ediyor. Carnegie Mellon ve BerriAI araştırmacıları tarafından yapılan ayrı bir araştırma, Gemini Pro'nun daha uzun ve daha karmaşık akıl yürütme zincirlerini yönetmede OpenAI'nin GPT-3.5'inden daha iyi performans gösterdiğini keşfetti.

Ancak çalışma, diğer büyük dil modelleri gibi Gemini Pro'nun da birkaç sayı gerektiren matematik konularında zorluklar yaşadığını ve kullanıcıların çok sayıda zayıf muhakeme ve hata örneği sunduğunu keşfetti. Mevcut Oscar'ları kimin kazandığı gibi basit sorularda birçok gerçek yanlışlığa neden oldu. Google değişiklik sözü verdi ancak bunların ne zaman gerçekleşeceği belli değil.

Gemini Pro ayrıca Google'ın girdi olarak metin alan ve çıktı olarak metin üreten, tamamen yönetilen yapay zeka geliştirici platformu Vertex AI'deki API aracılığıyla da kullanılabilir. Ekstra bir uç nokta olan Gemini Pro Vision, metinleri ve görüntüleri (fotoğraflar ve videolar dahil) yorumlayabilir ve OpenAI'nin GPT-4 with Vision modeline benzer metinler üretebilir.

Gemini Pro, geliştiriciler tarafından belirli durumlara ve Vertex AI içindeki kullanım senaryolarına göre ince ayar yapılabilir veya "temellendirilebilir". Gemini Pro ayrıca belirli görevleri gerçekleştirmek için diğer üçüncü taraf API'lere de bağlanabilir.

Geliştiricilerin hem Gemini Pro hem de Gemini Pro Vision uç noktalarına erişimi vardır ve çıktının yaratıcı aralığını yönetmek için model sıcaklığını değiştirebilir, ton ve stil yönergeleri vermek için örnekler sunabilir ve güvenlik parametrelerine ince ayar yapabilirler.

İkizler Cüce

Gemini Nano, Gemini Pro ve Ultra çeşitlerinin önemli ölçüde daha küçük bir versiyonudur ve görevleri bir sunucuya iletmek yerine doğrudan (belirli) telefonlarda gerçekleştirecek kadar verimlidir. Şu ana kadar Pixel 8 Pro'nun iki özelliğini etkinleştiriyor: Kaydedici'de özetleme ve Gboard'da akıllı yanıt.

Gemini Nano artık Google'ın klavye yazılımı Gboard'da geliştirici önizlemesi olarak mevcut. Bir mesajlaşma uygulamasında bir tartışma yürütürken bir sonraki adımda ne söylemeniz gerektiğini öneren Akıllı Yanıt adı verilen bir işlevi etkinleştirir. İşlev şu anda yalnızca WhatsApp'ta mevcut ancak Google'a göre 2024'te ek uygulamalara eklenecek.

Gemini, OpenAI'nin GPT-4'ünden Daha mı İyi?

Gemini ailesinin Google'ın bu yılın sonlarında Ultra'yı piyasaya sürmesine kadar nasıl bir performans sergilediğini söylemenin bir yolu yok, ancak firma, genellikle OpenAI'nin GPT4'ü olan mevcut teknolojiye göre iyileştirmeler olduğunu iddia etti.

Google, Gemini Ultra'nın “büyük dil modeli araştırma ve geliştirmesinde kullanılan yaygın olarak kullanılan 30 akademik kıyaslamadan 32'una ilişkin mevcut en son bulgulardan daha iyi performans gösterdiğini söyleyerek Gemini'nin kıyaslamadaki avantajını defalarca vurguladı. İşletmeye göre Gemini Pro, içerik özetleme, fikir oluşturma ve yazma gibi faaliyetlerde GPT-3.5'ten daha iyi performans gösteriyor.

Kıyaslamaların üstün bir modeli ima edip etmediği sorusunu bir kenara bırakırsak, Google'ın puanları OpenAI'nin benzer modellerinden çok az daha iyi görünüyor. Daha önce de söylediğimiz gibi, kullanıcıların ve akademisyenlerin Gemini Pro'nun temel bilgileri sıklıkla yanlış anladığını, çevirilerde sorunlar yaşadığını ve kötü kod tavsiyeleri sağladığını iddia etmesiyle bazı ilk izlenimler olumsuz oldu.

Gemini'nin maliyeti ne kadar olacak?

Gemini Pro'nun kullanımı şu anda Bard'ın yanı sıra AI Studio ve Vertex AI'da da ücretsizdir.

Gemini Pro, Vertex'te önizlemeden çıktığında model maliyeti $0.0025 karakter başına, ancak çıktı maliyetleri $0.00005 her karakter için. Vertex müşterileri 1,000 karakter (yaklaşık 140 ila 250 kelime) başına veya Gemini Pro Vision gibi modellerde her resim için ödeme yapar. ($ 0.0025).

Gemini'yi nerede deneyebilirsiniz?

İkizler Uzmanı

Gemini Pro en kolay şekilde Bard'da deneyimlenir. Pro'nun ince ayarlı bir sürümü şu anda Amerika Birleşik Devletleri'nde İngilizce metin tabanlı Bard sorgularını ele alıyor ve daha sonra daha fazla dil ve ülke eklenecek.

Gemini Pro ayrıca bir API aracılığıyla Vertex AI üzerinde önizleme olarak mevcuttur. API artık "sınır dahilinde" ücretsiz olarak kullanılabiliyor ve Avrupa da dahil olmak üzere 38 dil ve konumun yanı sıra sohbet özellikleri ve filtreler gibi özellikleri de destekliyor.

Alternatif olarak Gemini Pro'ya AI Studio'dan erişilebilir. Geliştiriciler, API anahtarlarını almadan önce istemleri ve Gemini tabanlı sohbet robotlarını uygulamalarında kullanmak veya kodu daha zengin özelliklere sahip bir IDE'ye aktarmak için bu hizmeti kullanabilirler.

İkizler Cüce

Pixel 8 Pro, gelecekte ek cihazlarda kullanılabilecek olan Gemini Nano'ya sahiptir. Modeli Android uygulamalarına dahil etmek isteyen geliştiriciler ön inceleme için bir araya gelebilir.

Yorum bırak

E-posta hesabınız yayımlanmayacak. Gerekli alanlar işaretlenmişlerdir. *