Milla Jovovich otwarcie deklaruje, że nie jest programistką, a jednak, wraz z deweloperem Benem Sigmanem, zbudowała system w zaledwie kilka miesięcy. Jak przyznaje sama autorka, większość kodu została wygenerowana przez Claude Code. Jak podaje Devstock oraz Wyborcza, jakość kodu stworzonego w ten sposób jest na tyle wysoka, że projekt zyskał uznanie społeczności, zdobywając 7000 gwiazdek na GitHubie w 24 godziny. Pokazuje to, że dzięki symbiozie człowieka z AI, konkurencyjne rozwiązania mogą dziś tworzyć osoby spoza ścisłej branży deweloperskiej.
MemPalace powstał z prozaicznej potrzeby – walki z brakiem ciągłości w rozmowach z modelami językowymi. Jovovich zauważyła, że każda nowa sesja z ChatGPT czy Claude wymaga ponownego tłumaczenia kontekstu i wklejania danych.
Jak działa MemPalace?
Narzędzie przechowuje pełne wymiany zdań bez utraty niuansów i twardych danych, a rozmowy trafiają do lokalnej bazy wektorowej na urządzeniu użytkownika (ChromaDB). Co więcej, system nie wymaga dodatkowych wywołań LLM do oceny, co warto zapamiętać – zapisuje wszystko, a selekcję pozostawia wyszukiwaniu semantycznemu.
Wyświetl ten post na Instagramie
Zbyt… idealne wyniki?
Choć MemPalace jest uznawany za jeden z najlepszych otwartych systemów pamięci, wokół jego wydajności wywiązała się dyskusja. Autorzy zadeklarowali bowiem 100% skuteczności w benchmarku LongMemEval.
Jak zauważono w Community Note na platformie X, wynik ten osiągnięto dzięki zastosowaniu specyficznych poprawek pod konkretne błędy. W testach na danych, których autorzy nie widzieli wcześniej (tzw. held-out), skuteczność wyniosła 98,4%.
Mimo tych uściśleń, wynik pozostaje imponujący i przewyższa wiele komercyjnych rozwiązań. Eksperci zaznaczają jednak, że LongMemEval to test syntetyczny, a realna jakość działania systemu w codziennych, unikalnych rozmowach użytkowników może się różnić od wyników laboratoryjnych.