OpenAI prezentuje ChatGPT-4o

Ten artykuł przeczytasz w 2 minuty

OpenAI, twórcy popularnego ChatGPT, ogłosiła wprowadzenie na rynek swojego nowego modelu językowego, GPT-4o. Literka „o” w nazwie GPT-4o oznacza „omni”, co sygnalizuje zdolność modelu do obsługi tekstu, mowy i wideo. Nowy model to ulepszenie w stosunku do poprzednika, GPT-4 Turbo, oferując zwiększone możliwości, szybsze przetwarzanie i oszczędności kosztów dla użytkowników.

GPT-4o już dostępny do użytku

ChatGPT-4o będzie zasilać chatbota ChatGPT od OpenAI oraz API, umożliwiając programistom wykorzystanie możliwości modelu. Nowy model jest dostępny zarówno dla użytkowników darmowych, jak i płatnych, z niektórymi funkcjami dostępnymi od razu, a innymi w kolejnych tygodniach.

Znaczna poprawa osiągów

Nowy model przynosi znaczącą poprawę szybkości przetwarzania, 50% redukcję kosztów, pięciokrotnie wyższe limity stawek i obsługę ponad 50 języków. OpenAI planuje stopniowe wprowadzanie nowego modelu do użytkowników ChatGPT Plus i Team, z dostępnością dla przedsiębiorstw. Firma zaczęła również wprowadzać nowy model dla użytkowników ChatGPT Free, choć z limitami użytkowania.

ChatGPT idzie na wojnę głosową

W nadchodzących tygodniach OpenAI wprowadzi ulepszone funkcje głosowe i wideo dla ChatGPT. Możliwości głosowe ChatGPT mogą zaostrzyć konkurencję z innymi asystentami głosowymi, takimi jak Siri od Apple, Google od Alphabet i Alexa od Amazon. Użytkownicy mogą teraz przerywać ChatGPT podczas żądań, aby symulować bardziej naturalną rozmowę.

GPT-4o znacznie poprawia doświadczenia głosowe

Platforma od dawna oferowała tryb głosowy, który transkrybował odpowiedzi chatbota za pomocą modelu tekst-na-mowę, ale GPT-4o to jeszcze bardziej usprawnia, pozwalając użytkownikom wchodzić w interakcje z ChatGPT bardziej jak z asystentem. Model zapewnia odpowiedzi „w czasie rzeczywistym” i może nawet wyłapywać niuanse w głosie użytkownika, generując odpowiedzi głosowe „w różnych emocjonalnych stylach”.

ChatGPT wyjaśni Ci zasady gry w czasie rzeczywistym

GPT-4o również ulepsza możliwości wizyjne ChatGPT. Dostarczając zdjęcie — lub ekran komputera — ChatGPT może teraz szybko odpowiadać na powiązane pytania, od tematów takich jak „Co się dzieje w tym kodzie oprogramowania?” do „Jakiej marki jest koszulka tej osoby?”. Te funkcje będą się rozwijać w przyszłości, a model potencjalnie pozwoli ChatGPT na „oglądanie” na żywo meczu sportowego i wyjaśnianie zasad.

Wielojęzyczność, reakcja na emocje użytkowników i zdecydowanie lepsze osiągi

GPT-4o jest bardziej wielojęzyczny, z ulepszoną wydajnością w około 50 językach. W API OpenAI i usłudze Azure OpenAI Microsoft, GPT-4o jest dwa razy szybszy, połowę tańszy i ma wyższe limity stawek niż GPT-4 Turbo.

Podczas demonstracji GPT-4o pokazał, że potrafi rozumieć emocje użytkowników, słuchając ich oddechu. Kiedy zauważył, że użytkownik jest zestresowany, zaoferował porady, które pomogły mu się zrelaksować. Model pokazał również, że potrafi prowadzić rozmowy w wielu językach, tłumacząc i odpowiadając na pytania automatycznie.

Podsumowanie

Ogłoszenia OpenAI pokazują, jak szybko rozwija się świat AI. Ulepszenia w modelach i szybkość, z jaką działają, wraz z możliwością łączenia wielomodalnych zdolności w jednym interfejsie omni-modalnym, zmieniają sposób, w jaki ludzie wchodzą w interakcję z tymi narzędziami.

Całoś prezentacji firmy OpenAI możesz zobaczyć poniżej.

Cytowania:
[1] [Investopedia: OpenAI wprowadza najbardziej zdolny model AI, GPT-4o](https://www.investopedia.com/microsoft-backed-openai-unveils-most-capable-ai-model-gpt-4o-8647639)
[2] [TechCrunch: Najnowszy model OpenAI to GPT-4o](https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/)
[3] [PYMNTS: OpenAI wprowadza GPT-4o, obiecując szybszą wydajność i ulepszone możliwości](https://www.pymnts.com/artificial-intelligence-2/2024/openai-unveils-gpt-4o-promising-faster-performance-and-enhanced-capabilities/)

Możliwość dodawania komentarzy nie jest dostępna.

error: Treści MENSIDER.COM są chronione.