Gemini to model sztucznej inteligencji. Został on zbudowany od podstaw z założeniem, że ma być modelem multimodalnym, czyli takim, który może generalizować i z łatwością rozumieć, wykorzystywać i łączyć różne rodzaje informacji, w tym tekst, obrazy, dźwięki, filmy i kod. Gemini jest ponadto najbardziej elastycznym z modeli Google, ponieważ działa sprawnie na dowolnych urządzeniach – od centrów danych po urządzenia mobilne. Dzięki swoim ultranowoczesnym możliwościom będzie mieć znaczący wpływ na sposób, w jaki deweloperzy i klienci biznesowi tworzą i skalują swoje działania z wykorzystaniem AI.
Optymalizacja modelu Gemini
Pierwsza wersja modelu, Gemini 1.0, została zoptymalizowana dla trzech różnych rozmiarów:
-
Gemini Ultra — nasz najbardziej wydajny i największy model do bardzo złożonych zadań
-
Gemini Pro — nasz najlepszy model do skalowania w szerokim zakresie zadań
-
Gemini Nano — nasz najbardziej wydajny model do zadań na urządzeniu
Dostępność modelu Gemini na świecie
Obecnie Google wprowadza model Gemini 1.0 w wielu usługach i na różnych platformach.
-
Od dzisiaj Bard będzie używał Gemini Pro. Będzie on dostępny w języku angielskim w ponad 170 krajach i regionach, a w najbliższej przyszłości planujemy rozszerzenie dostępnych opcji oraz udostępnienie usługi w kolejnych miejscach i językach.
-
Od 13 grudnia deweloperzy i klienci biznesowi będą mieli dostęp do modelu Gemini Pro poprzez Gemini API w Google AI Studio lub Google Cloud Vertex AI
Nowoczesne działanie
Model Gemini testowano na najróżniejszych zadaniach. Od rozumienia naturalnych obrazów przez rozumowanie matematyczne po analizę materiałów audio i wideo. Wyniki Gemini Ultra przewyższają obecne osiągnięcia w 30 z 32 powszechnie stosowanych testów i standardów akademickich, stosowanych w badaniach i rozwoju dużych modeli językowych (LLM).
Z wynikiem 90,00% Gemini Ultra jest pierwszym modelem, który przewyższa w działaniu ekspertów w zakresie MMLU (masowe wielozadaniowe rozumienie języka). MMLU wykorzystuje połączenie 57 dziedzin nauki, takich jak matematyka, fizyka, historia, prawo, medycyna czy etyka, w celu testowania zarówno światowej wiedzy, jak i możliwości rozwiązywania problemów.
Umiejętne wykorzystanie MMLU umożliwia Gemini wykorzystanie zdolności rozumowania do dokładniejszego przemyślenia przed udzieleniem odpowiedzi na trudne pytania.
Wszystkie ogłoszenia można znaleźć na blogu globalnym:
- Introducing Gemini: our largest and most capable AI model
- Enabling next-generation AI workloads: Announcing AI Hypercomputer and TPU v5p
- Bard gets its biggest upgrade yet with Gemini
- Gemini Nano now powers on-device generative AI features for Pixel 8 Pro
- A New Foundation for AI on Android
Zobacz także
Eilla pozyskała 1,5 mln dolarów, by pomóc inwestorom w podejmowaniu decyzji
Bookero nawiązuje współpracę z Google – system do zarządzania rezerwacjami od polskiego startupu