Teknoloji

OpenAI, yeni ChatGPT modeli GPT-4o’yu ve fazlasını tanıttı

Geçtiğimiz hafta, Google’ın yapay zekaya odaklanacak olan büyük I/O 2024 etkinliğine bir haftadan kısa bir süre kala ortaya çıkan haberler, OpenAI’nin ChatGPT’nin Google Arama’ya rakip olacak bir sürümünü duyuracağını belirtiyordu. ChatGPT’nin gerçek zamanlı internet verilerine erişimini güçlendirecek bir Google Arama alternatifi, OpenAI’nin ihtiyaç duyduğu özellik olabilir ve web’de arama yapmak için Google’a alternatif bir yol arayan kullanıcıların geneline hitap edebilirdi.

Ancak, OpenAI’den Sam Altman bu söylentiyi hızlı bir şekilde yalanladı. Başka bir deyişle, OpenAI’nin Google Arama için bir rakip duyurmayacağını – en azından şimdilik – biliyorduk. Yine de, OpenAI’nin 13 Mayıs tarihinde gizemli bir ChatGPT etkinliği düzenleyeceği yönetici tarafından doğrulanmıştı.

Ve işte o etkinlik gerçekleştirildi. Peki OpenAI, bu etkinlikte neler duyurdu?

ChatGPT 4o (Omni)

OpenAI, öncelikle ses, görüntü ve metin girdilerini kabul edebilen ve ayrıca ses, görüntü ve metin olarak çıktılar üretebilen yeni bir ChatGPT sürümünü duyurdu. Şirket, ChatGPT’nin yeni sürümünü 4o olarak adlandırıyor ve “o” harfi “tüm” anlamına gelen birleşik bir kelime olan “omni” anlamında kullanılıyor.

OpenAI, ChatGPT’nin bu yeni sürümünü, kullanıcı girdilerine insandan insana konuşmalarla aynı hızda yanıt veren daha doğal insan ve makine etkileşimlerine doğru bir ilerleme olarak tanımladı. Yeni sürüm İngilizce’de ChatGPT 4 Turbo ile eşleşiyor ve diğer dillerde Turbo’dan önemli ölçüde daha iyi performans gösteriyor. API performansında önemli bir gelişme var, hız artıyor ve %50 daha az maliyetle çalışıyor.

Şirket ChatGPT 4o’yu şöyle açıklıyor: “GPT-4o, geleneksel kıyaslamalarla ölçüldüğünde metin, muhakeme ve kodlama zekasında GPT-4 Turbo düzeyinde performansa ulaşırken, çok dilli, ses ve görüntü yeteneklerinde yeni yüksek filigranlar belirliyor.”

ChatGPT 4o özellikleri neler?

Gelişmiş Ses İşleme: Sesle iletişim kurmaya yönelik önceki yöntem, ses girdilerini metne dönüştürmek için üç farklı modeli bir araya getirmeyi içeriyordu; ikinci model (GPT 3.5 veya GPT-4) bunu işliyor ve metin çıktısı veriyor, üçüncü model ise metni tekrar sese dönüştürüyordu. Bu yöntemin çeşitli çevirilerdeki nüansları kaybettiği söyleniyordu.

OpenAI, yeni yaklaşımla üstesinden gelinen dezavantajları şöyle açıklıyor: “Bu süreç, ana zeka kaynağı olan GPT-4’ün çok fazla bilgi kaybettiği anlamına geliyor; tonu, birden fazla konuşmacıyı ya da arka plan seslerini doğrudan gözlemleyemiyor ve kahkaha, şarkı ya da duyguları ifade edemiyor.”

Yeni versiyon üç farklı modele ihtiyaç duymuyor çünkü tüm giriş ve çıkışlar uçtan uca ses girişi ve çıkışı için tek bir modelde birlikte ele alınıyor. İlginç bir şekilde OpenAI, yeni modelin tüm yeteneklerini henüz keşfetmediklerini veya sınırlamalarını tam olarak anlamadıklarını belirtiyor.

Yeni Guardrails ve Yinelemeli Sürüm: OpenAI GPT 4o, güvenlik için istenmeyen ses çıkışlarını önlemek ve güvenli tutmak için yeni filtreler içeriyor. Ancak bugünkü duyuruda, başlangıçta yalnızca metin ve görüntü girişleri ile metin çıkışları ve sınırlı bir ses için yetenekleri kullanıma sundukları belirtiliyor. GPT 4o hem ücretsiz hem de ücretli katmanlar için mevcut olup Plus kullanıcıları 5 kat daha yüksek mesaj limitine sahip. Başka bir deyişle, para ödemek istemeyenler de, küçük bir kısıtlama olsa da, GPT 4o’yu kullanabiliyor.

ChatGPT sesli asistan

OpenAI, ChatGPT tabanlı, kullanıcılarla ses ve metin yoluyla iletişim kurabilen, çok modlu bir yapay zeka asistanını da tanıttı. Ayrıca bu ürün, nesneleri ve görüntüleri de tanıyabiliyor. Belki de daha da ilgi çekici ve etkileyici bir şekilde, bu ChatGPT ürününün daha iyi mantıksal akıl yürütme performansı gösterebileceği de iddia ediliyor.

GPT 4o tarafından desteklenen çok modlu asistanın, görüntüler ve seslerle uğraşırken OpenAI’nin mevcut yeteneklerinden daha hızlı ve daha doğru çalışması bekleniyor. ChatGPT asistanı, arayanların seslerinin tonlamasını bile algılayarak şaka yapıp yapmadıklarını belirleyebiliyor. Bu asistanın, şimdilik müşteri desteği için kullanılacağı söyleniyor.

The Information’ın edindiği bilgilere göre yapay zeka asistanı yol işaretlerini de görebiliyor ve tercüme edebiliyor. Aynı zamanda öğrencilere matematik problemlerinde yardım etmek gibi diğer istemlerle de ilgilenebiliyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu