Mezihvězdné ambice a tvrdé dopady na zem

Zatímco se Jeff Bezos snaží pochopit, proč se jeho obří raketa New Glenn od Blue Origin zasekla v nekonečné smyčce odkladů a technických selhání, v Praze a Mnichově se odehrává tichá revoluce, která má na život průměrného smrtelníka (nebo aspoň toho, co píše kód) mnohem větší dopad. JetBrains, firma, kterou zná každý, kdo někdy v životě otevřel pořádné IDE, právě vypustila do světa Mellum2. Je to model typu Mixture-of-Experts (MoE) s 12 miliardami parametrů a upřímně řečeno, je to přesně ten políček do tváře OpenAI a Googlu, který jsme potřebovali. Zapomeňte na univerzální modely, které umí napsat báseň o lásce i kód v Cobolu, ale obojí dělají tak napůl. Mellum2 je chirurgický skalpel v rukou programátora.

Mezihvězdné ambice a tvrdé dopady na zem

Pád New Glenn od Blue Origin je fascinující metaforou pro dnešní svět velkých jazykových modelů (LLM). Všichni chtějí postavit tu největší raketu, největší cluster, nejvíc parametrů. Jenže když stavíte monstra, která se snaží obsáhnout celé lidské vědění, začnou se dít divné věci. Modely začnou halucinovat, jsou pomalé, drahé na provoz a jejich „všeobjímající“ inteligence je vám k ničemu, když potřebujete jen vyřešit race condition v Go. JetBrains na to šlo jinak. Místo aby stavěli další „Starship“ mezi modely, vytvořili efektivní, rychlou a nesmírně přesnou „stíhačku“.

Mellum2 není jen vylepšením první verze. Je to kompletní změna paradigmatu v tom, jak JetBrains uvažuje o AI ve svých produktech jako IntelliJ IDEA, PyCharm nebo WebStorm. Zatímco Microsoft se svým Copilotem sází na to, že do cloudu pošlete úplně všechno a budete doufat, že vám GPT-4o vrátí něco smysluplného, JetBrains sází na lokální kontext a specializaci. Mellum2 je navrženo tak, aby rozumělo sémantice kódu, ne jen statistické pravděpodobnosti slov. Je to rozdíl mezi tím, když se zeptáte náhodného kolemjdoucího na cestu, a tím, když se podíváte do podrobné mapy.

Problém Blue Origin byl v tom, že se snažili o příliš velký skok najednou bez dostatečné iterace v reálném provozu. JetBrains naopak využívá miliony hodin dat z reálného používání svých IDE. Mellum2 tak přesně ví, co vývojář dělá vteřinu předtím, než začne psát. To není magie, to je tvrdá data a optimalizace. A zatímco rakety padají, kód s Mellum2 začíná konečně dávat smysl i bez toho, abyste u toho zestárli o deset let čekáním na odpověď ze serveru v Oregonu.

Pod kapotou Mellum2: Proč 12 miliard stačí, když víte, co děláte

Technologičtí nadšenci se často honí za čísly. „Máš 70B model? Já mám 405B Llama 3!“ Jenže v praxi, když sedíte v IDE a potřebujete dopisovat kód v reálném čase, je vám 405 miliard parametrů k ničemu, protože latence vás zabije. Mellum2 používá architekturu Mixture-of-Experts (MoE). Pro ty, co nedávají pozor: MoE znamená, že model sice má 12 miliard parametrů, ale při každém dotazu se aktivuje jen jejich malá část (typicky kolem 2–3 miliard). Je to jako mít v týmu dvanáct specialistů, ale na každou otázku odpovídají jen ti dva, kteří o tom fakt něco vědí. Zbytek týmu mlčí a šetří energii (a váš procesor).

Tento přístup umožňuje Mellum2 dosáhnout výkonu, který se vyrovná mnohem větším modelům, ale s rychlostí blesku. JetBrains uvádí, že latence při generování prvního tokenu klesla oproti předchozí verzi o desítky procent. To je kritické. Pokud AI trvá víc než 200 milisekund, než vám začne něco našeptávat, váš mozek už přepnul jinam. Mellum2 se drží pod touto hranicí. Navíc díky tomu, že je model kompaktní, se otevírají dveře k něčemu, co bylo dřív nemyslitelné – k plně lokálnímu běhu bez kompromisů.

Pokud se podíváte na HuggingFace (https://huggingface.co), najdete tam spoustu modelů v kategorii 7B nebo 12B, ale Mellum2 vyniká svým trénovacím datasetem. JetBrains ho „krmili“ výhradně kvalitním kódem, dokumentací a logy z commitů. Žádné recepty na bábovku, žádné politické diskuse z Redditu. Výsledkem je model, který nepíše „povídky o kódu“, ale píše kód. A co je nejlepší? Mellum2 nativně podporuje desítky programovacích jazyků, od mainstreamové Javy a Pythonu až po exotičtější kousky jako Rust nebo Kotlin, u kterých má JetBrains logicky nejlepší data na světě.

Lokální AI jako standard: Jak to rozchodit bez cloudu a šmírování

Největší strašák firem při adopci AI? Bezpečnost a soukromí. Posílat zdrojové kódy vašeho unikátního algoritmu na servery třetí strany je pro spoustu korporací (a i rozumných freelancerů) naprosté tabu. Mellum2 je navrženo s ohledem na to, že budoucnost je hybridní nebo čistě lokální. I když JetBrains zatím primárně nabízí model skrze svou infrastrukturu (kvůli škálování a jednoduchosti pro uživatele), jeho architektura je připravená na to, aby vám „seděla“ přímo na stroji.

Pokud máte v notebooku čip Apple M3 Max nebo pořádnou grafiku od Nvidie (RTX 4080 a výš), Mellum2 by teoreticky mohl běžet přímo tam. Pro ty, kteří chtějí experimentovat už teď, existují nástroje jako Ollama nebo různé implementace LoRA, které umožňují podobně velké modely provozovat lokálně s minimální ztrátou kvality. Stačí vzít kvantizovanou verzi (např. v 4-bitovém GGUF formátu) a najednou máte v terminálu inteligenci, která nepotřebuje Wi-Fi. Je to osvobozující pocit – nebýt závislý na tom, jestli Azure zrovna nemá výpadek.

Tento trend lokálního hostování AI úzce souvisí i s náklady. Cloudové AI předplatné stojí typicky 20 dolarů měsíčně na uživatele. Pro firmu se 100 vývojáři je to 2 000 dolarů měsíčně, tedy přes půl milionu korun ročně jen za to, aby vám někdo našeptával závorky. Vlastní infrastruktura, postavená na open-source alternativách nebo specializovaných modelech jako Mellum2, se zaplatí extrémně rychle. A pokud řešíte, kde na tyhle „výpočetní farmy“ vzít energii a jak to celé ufinancovat, řešením může být SmartEnergyShare.com, který umožňuje efektivní správu energií i pro takto náročné technologické projekty. Více o možnostech sdílení energie najdete například na [SdileniEnergie.info](https://sdilenienergie.info).

Od „kecálků“ k agentům: Proč samotné LLM už nikoho nezajímá

Svět se posouvá dál. ChatGPT byl fajn na ohromení babičky u vánočního stromečku, ale pro enterprise nasazení jsou samotné LLM užitečné asi jako encyklopedie v knihovně – ví hodně, ale nic neudělají. Budoucnost patří „Agent Logic“. To je směr, kterým jde i Mellum2. Nejde jen o to, že vám model napíše kousek kódu. Jde o to, že model chápe kontext celého projektu, dokáže si „sáhnout“ na souborový systém, spustit testy, podívat se na chybu v CI/CD pipeline a navrhnout komplexní opravu napříč pěti soubory.

JetBrains integruje Mellum2 do svého ekosystému tak, aby fungovalo jako autonomní agent. Představte si to takhle: Místo „Napiš mi funkci pro validaci e-mailu“ mu řeknete „Refaktoruj celou autentizační vrstvu tak, aby používala JWT místo sessions a aktualizuj všechny související testy“. Mellum2 nezačne jen tupě generovat text. Nejdřív si zanalyzuje závislosti, vytvoří si plán (to je ta agentní část) a pak začne provádět změny. To vyžaduje mnohem víc než jen obří neuronku – vyžaduje to hlubokou integraci s IDE, kterou nikdo jiný než JetBrains nemá.

Tento posun k agentům je přesně to, co odliší úspěšné firmy od těch, které AI jen „zkoušejí“. Enterprise adopce nezávisí na tom, jak vtipný je chatbot, ale na tom, kolik reálné práce dokáže odbavit bez neustálého dozoru. A tady narážíme na limity. Čím víc agentů vám běží, tím víc výkonu potřebujete. A čím víc výkonu, tím víc elektřiny. Pokud vaše vývojářské centrum začne žrát jako středně velká fabrika, budete muset řešit věci jako day trading s elektřinou nebo obchodování odchylek, abyste nezkrachovali na účtech za proud. Právě zde SmartEnergyShare nabízí řešení v podobě správy bateriových úložišť (BESS) a optimalizace spotřeby. O tom, jak smart grid a AI mění energetiku, se dočtete na SmartEnergyShare.info.

Energetická náročnost vývoje: Když AI začne točit elektroměrem

Nalijme si čistého vína – provozovat 12B model pro tisíce vývojářů v reálném čase není zadarmo, a to ani v cloudu, ani lokálně. Každý token, který Mellum2 vygeneruje, vyžaduje energii. V době, kdy se cena elektřiny mění každou hodinu a tlak na ESG (Environmental, Social, and Governance) roste, se efektivita modelu stává klíčovým parametrem. Mellum2 díky své MoE architektuře není jen rychlé, ale i relativně úsporné. Aktivovat 2 miliardy parametrů místo 12 (nebo 175 u starého GPT-3) znamená přímou úsporu v kilowatthodinách.

Pro české firmy, které chtějí být na špici, to znamená jediné: AI se musí stát součástí širší energetické strategie. Nemůžete prostě jen „přidat servery“. Musíte uvažovat o tom, kdy ty servery běží. Pokud Mellum2 trénuje nové indexy vašeho kódu v noci, kdy je elektřina levná nebo jí je v síti nadbytek, šetříte peníze. Pokud máte na střeše budovy fotovoltaiku a v suterénu baterii o kapacitě 100 kWh, můžete své AI agenty nechat „přemýšlet“ úplně zadarmo.

SmartEnergyShare nabízí nástroje, jak tuhle technologickou a energetickou vrstvu propojit. Obchodování s bateriemi a flexibilita sítě jsou přesně ty pojmy, které by měly zajímat i CTO moderní softwarové firmy. Protože co je vám platné, že máte nejchytřejší IDE na světě, když vám provozní náklady na infrastrukturu sežerou marži? Mellum2 je důkazem, že software se stává chytřejším a efektivnějším, ale bez robustní energetické základny zůstane jen hračkou pro vyvolené. A pokud chcete vědět, jak na sdílení energie ve vaší komunitě nebo firmě, mrkněte na ShareElectric.cz.

Závěrem? Mellum2 od JetBrains je jasným signálem, že éra „jednoho modelu pro všechno“ končí. Přichází doba specializovaných, rychlých a efektivních modelů, které nepotřebují výkon superpočítače k tomu, aby vám pomohly opravit bug v kódu. Je to návrat k inženýrskému rozumu – dělat věci tak velké, jak je potřeba, a ani o milimetr víc. Zatímco Jeff Bezos dál ladí své raketové motory, my můžeme začít psát lepší kód už dnes. A to je, upřímně, mnohem užitečnější mise.

Zdroje

- JetBrains AI Assistant: Mellum2 Overview - HuggingFace: Mixture of Experts Explained - OTE-CR: Denní trh s elektřinou - ČEPS: Data o provozu soustavy - SmartEnergyShare: Energetická flexibilita a BESS

Obchodujete s batteriovými úložišti nebo hledáte partnera pro flexibilitu a day trading elektřiny? SmartEnergyShare nabízí kompletní řešení pro BESS projekty od 50 do 250 kW - obchodování odchylek, regulační elektřiny a intraday trading. Zjistěte víc na SmartEnergyShare.

Další články na toto téma najdete na: SmartEnergyShare.cz - baterie, VPP a balkónové elektrárny BESS Global - bateriová úložiště a trading