Google przedstawił nowy model AI z zaawansowanymi funkcjami

Google przedstawił serię ogłoszeń na temat przełomu w dziedzinie sztucznej inteligencji — największego i najpotężniejszego modelu AI o nazwie Gemini. Model ten powstał w efekcie szeroko zakrojonej współpracy wielu zespołów w Google, w tym Google DeepMind i Google Research, i jest największym projektem naukowo-inżynierskim w historii Google.

Gemini to model sztucznej inteligencji. Został on zbudowany od podstaw z założeniem, że ma być modelem multimodalnym, czyli takim, który może generalizować i z łatwością rozumieć, wykorzystywać i łączyć różne rodzaje informacji, w tym tekst, obrazy, dźwięki, filmy i kod. Gemini jest ponadto najbardziej elastycznym z modeli Google, ponieważ działa sprawnie na dowolnych urządzeniach – od centrów danych po urządzenia mobilne. Dzięki swoim ultranowoczesnym możliwościom będzie mieć znaczący wpływ na sposób, w jaki deweloperzy i klienci biznesowi tworzą i skalują swoje działania z wykorzystaniem AI.

Optymalizacja modelu Gemini

Pierwsza wersja modelu, Gemini 1.0, została zoptymalizowana dla trzech różnych rozmiarów:

Gemini Ultra — nasz najbardziej wydajny i największy model do bardzo złożonych zadań
Gemini Pro — nasz najlepszy model do skalowania w szerokim zakresie zadań
Gemini Nano — nasz najbardziej wydajny model do zadań na urządzeniu

Dostępność modelu Gemini na świecie

Obecnie Google wprowadza model Gemini 1.0 w wielu usługach i na różnych platformach.

Od dzisiaj Bard będzie używał Gemini Pro. Będzie on dostępny w języku angielskim w ponad 170 krajach i regionach, a w najbliższej przyszłości planujemy rozszerzenie dostępnych opcji oraz udostępnienie usługi w kolejnych miejscach i językach.
Od 13 grudnia deweloperzy i klienci biznesowi będą mieli dostęp do modelu Gemini Pro poprzez Gemini API w Google AI Studio lub Google Cloud Vertex AI

Nowoczesne działanie

Model Gemini testowano na najróżniejszych zadaniach. Od rozumienia naturalnych obrazów przez rozumowanie matematyczne po analizę materiałów audio i wideo. Wyniki Gemini Ultra przewyższają obecne osiągnięcia w 30 z 32 powszechnie stosowanych testów i standardów akademickich, stosowanych w badaniach i rozwoju dużych modeli językowych (LLM).

Z wynikiem 90,00% Gemini Ultra jest pierwszym modelem, który przewyższa w działaniu ekspertów w zakresie MMLU (masowe wielozadaniowe rozumienie języka). MMLU wykorzystuje połączenie 57 dziedzin nauki, takich jak matematyka, fizyka, historia, prawo, medycyna czy etyka, w celu testowania zarówno światowej wiedzy, jak i możliwości rozwiązywania problemów.

Umiejętne wykorzystanie MMLU umożliwia Gemini wykorzystanie zdolności rozumowania do dokładniejszego przemyślenia przed udzieleniem odpowiedzi na trudne pytania.

Wszystkie ogłoszenia można znaleźć na blogu globalnym:

Zobacz także

Eilla pozyskała 1,5 mln dolarów, by pomóc inwestorom w podejmowaniu decyzji

Bookero nawiązuje współpracę z Google – system do zarządzania rezerwacjami od polskiego startupu