Patrick Zandl's Blog: Marigold.cz, page 10
March 26, 2025
Propojení Google Search Console s MCP - Komplexní průvodce
Model Communication Protocol (MCP) představuje inovativní způsob, jak propojit AI asistenty s externími službami a nástroji. Google Search Console (GSC) je neocenitelný nástroj pro SEO analýzu a monitoring webových stránek. Propojení těchto dvou technologií otevírá vývojářům a SEO specialistům nové možnosti automatizace a efektivní práce s daty o výkonu webových stránek.
Tento průvodce vám ukáže, jak implementovat integraci mezi Google Search Console a MCP pomocí otevřeného řešení dostupného na GitHubu od AminForou. Díky této integraci budete moci:
Získávat data z Google Search Console přímo ve vašem AI asistentovi Analyzovat výkon webových stránek bez nutnosti přepínat mezi aplikacemi Automatizovat reporting a monitoring klíčových SEO metrik Implementovat datově řízené úpravy obsahu a SEO strategiePožadavky pro úspěšnou integraciPřed začátkem integrace se ujistěte, že máte připraveno:
Google Search Console účet s přístupem k webovým stránkám, které chcete monitorovat Google Cloud projekt s povoleným Google Search Console API MCP server (například Zapier MCP) Cursor nebo jiného AI asistenta podporujícího MCP Node.js (verze 14 nebo novější) pro spuštění GSC konektoru Git pro klonování repozitáře1. Příprava Google Cloud projektu a API přístupuVytvoření a konfigurace projektu v Google Cloud Přejděte na Google Cloud Console Vytvořte nový projekt nebo vyberte existující V navigačním menu vyberte “APIs & Services” > “Library” Vyhledejte “Google Search Console API” a aktivujte jej Přejděte do sekce “Credentials” a vytvořte nové OAuth 2.0 přihlašovací údaje: Typ aplikace: Web application Název: MCP GSC Integration Autorizované přesměrovací URI: http://localhost:3000/oauth2callback Stáhněte vygenerovaný JSON soubor s přihlašovacími údaji2. Instalace MCP GSC konektoru# Klonování repozitářegit clone https://github.com/AminForou/mcp-gsc.... mcp-gsc# Instalace závislostínpm install# Kopírování konfiguračního souborucp config.example.json config.json3. Konfigurace MCP GSC konektoruOtevřete soubor config.json a upravte následující hodnoty:
{ "port": 3000, "auth": { "clientId": "YOUR_CLIENT_ID", "clientSecret": "YOUR_CLIENT_SECRET", "redirectUri": "http://localhost:3000/oauth2callback" }, "sites": [ "https://www.vasestranka.cz" ], "mcpEndpoint": "https://actions.zapier.com/mcp/YOUR_M..."}Nahraďte:
YOUR_CLIENT_ID a YOUR_CLIENT_SECRET hodnotami z vašeho Google Cloud projektu https://www.vasestranka.cz URL adresou vaší webové stránky registrované v Google Search Console YOUR_MCP_ID vaším unikátním identifikátorem ze Zapier MCP4. Autorizace Google Search Console APISpusťte aplikaci a dokončete autorizační proces:
npm start Při prvním spuštění se v konzoli zobrazí autorizační URL Otevřete URL ve webovém prohlížeči Přihlaste se ke Google účtu a udělte přístup k Search Console API Po úspěšné autorizaci budete přesměrováni zpět na lokální server V konzoli by se mělo zobrazit potvrzení úspěšné autorizace Autorizační token bude automaticky uložen pro budoucí použití5. Propojení s MCP serverem (Zapier)Nastavení v Zapier MCP Přejděte na Zapier MCP stránku Klikněte na “Get Started” a zkopírujte svou unikátní MCP URL Klikněte na “Edit MCP Actions” a vytvořte novou akci Pojmenujte akci “Google Search Console Data” Nastavte parametry akce: site: URL webu (STRING) dateRange: Rozsah dat (STRING: “last7days”, “last30days”, “last3months”) dimensions: Dimenze dat (STRING: “query”, “page”, “country”, “device”) Integrace do Cursor (nebo jiného AI asistenta) Otevřete Cursor a přejděte do Settings > MCP > Add New MCP Vložte MCP URL ze Zapier pod název “Google Search Console MCP” Uložte nastavení6. Používání GSC dat v AI asistentoviPo úspěšné integraci můžete začít využívat data z Google Search Console přímo ve vašem AI asistentovi. Zde jsou příklady typických dotazů:
Základní dotazy na výkon webuUkaž mi výkon mého webu z Google Search Console za posledních 30 dní.Analýza konkrétních klíčových slovJaké jsou moje nejúspěšnější klíčová slova podle počtu kliknutí za poslední týden?Identifikace problémových stránekKteré stránky mají vysoký počet zobrazení, ale nízkou míru prokliku?Analýza trendůPorovnej výkon mého webu v mobilních zařízeních oproti desktopům za poslední 3 měsíce.7. Rozšířené funkceMCP GSC konektor nabízí několik pokročilých funkcí, které můžete využít:
Vlastní časové rozsahyKromě předdefinovaných rozsahů můžete použít vlastní časové období:
{ "startDate": "2025-01-01", "endDate": "2025-03-26"}Filtry datFiltrování dat podle specifických kritérií:
{ "filters": [ { "dimension": "page", "operator": "contains", "expression": "/blog/" } ]}Agregace a transformace datKonektor umožňuje základní agregaci a transformaci dat:
{ "aggregation": "sum", "groupBy": "query"}8. Řešení problémůProblém: Autorizační chybaŘešení: Ujistěte se, že máte správně nakonfigurované přesměrovací URI v Google Cloud Console. Pokud problém přetrvává, smažte soubor [token](/ai/tokeny-versus-slova/).json a proveďte autorizaci znovu.
Problém: Žádná data nejsou dostupnáŘešení: Ověřte, že webová stránka je správně registrována v Google Search Console a že máte dostatečná oprávnění. Některé nově přidané stránky nemusí mít okamžitě dostupná data.
Problém: MCP nepřijímá požadavkyŘešení: Zkontrolujte, zda je MCP server spuštěn a dostupný. Ujistěte se, že adresa v config.json odpovídá vaší unikátní MCP URL.
9. Zabezpečení a best practicesPři práci s GSC API a MCP dbejte na následující bezpečnostní opatření:
Nikdy nesdílejte své OAuth přihlašovací údaje nebo tokeny Pravidelně obnovujte přístupové tokeny Používejte pouze nezbytná oprávnění pro vaši aplikaci Omezujte rozsah požadavků na API, abyste předešli dosažení limitů Implementujte rate limiting pro ochranu před zahlcením APIZávěrPropojení Google Search Console s MCP otevírá nové možnosti pro automatizaci SEO analýz a datově řízených rozhodnutí. Díky této integraci získáváte přímý přístup k cenným datům o výkonu vašich webových stránek přímo ve vašem AI asistentovi, což vám umožňuje efektivněji pracovat a činit informovaná rozhodnutí.
Pro nejnovější aktualizace a vylepšení sledujte oficiální GitHub repozitář a zapojte se do komunity přispěvatelů, kteří pomáhají toto řešení dále rozvíjet.
Poznámka: Tento průvodce vychází z dokumentace dostupné k březnu 2025. Některé funkce se mohou měnit s novými aktualizacemi Google Search Console API nebo MCP protokolu.
March 25, 2025
🧠 AI nástroje pro programování - přehled
Programování s AI začíná být stále populárnější. Jistě si budete chtít vyzkoušet nějaký nástroj, který vás provede světem vibe codingu či jen AI asistence při programování.
Tady se pokouším udělat větší seznam všech nástrojů. Musím říct, že použitelné AI nástroje se objevují teprve posledních několik měsíců, takže startovací pole je dost široké a každý den se vynořují nové a nové nástroje. Tento seznam pořizuju ne proto, abyste všechny nástroje prošli, ale abych si i sám udržel přehled.
Moje osobní doporučení:
pokud chcete jít “na jistotu” a zvládnete spouštění z příkazové řádky, rozhodně vyzkoušejte Claude Code. A ten můj zalinkovaný článek vám pomůže jej pochopit. Ideální na scripty! pokud byste si chtěli udělat plnohodnotnou webovou aplikaci, vyzkoušejte Databutton - dělá ho norská firma, je to velmi sympatické, rozloží to projekt na milestony, které s vámi plní a je to opravdu agentní, takže to všechno udělá za vás. Jen to nemá napojení na Github, zdrojáky si buďto stáhnete jako zip, nebo nasazujete na jejich server. Ale to se časem poddá. A je to webová aplikace, nic neinstalujete. pokud chcete výrazně promlouvat do grafického vzhledu vašeho projektu, tak vyzkoušejte Tempolabs. Opět webová aplikace, má i napojení na Figmu. pokud nepotřebujete detailně určovat vzhled a stačí vám “hezký” nebo “zhruba jako tohle”, tak vyzkoušejte Replit Agent (dražší) nebo Memex (levnější) - oba vás v podstatě odstíní od zdrojového kódu. Obojí je instalovatelná aplikace, pokud jste se někdy vývojařinou zabývali, jděte do Cursor nebo Windsurf - obojí vychází z Visual Studio Code a budete tam jak doma i s iluzí, že o něčem rozhodujete 😎 Začátečníkům bych tyhle programy spíš nedoporučil, tady už se fakt čeká, že developmentu rozumíte. pokud jste zkušený vývojář a tohle je pro vás hereze a úchylárna, zkuste GitHub Copilot moje osobní zkušenosti s řadou těchto nástrojů najdete zdeA teď už pojďme na přehled, pořadí je náhodné!
🧠 AI nástroje pro programování1. SoftgenAI Funkce: Funguje pro programátory i neprogramátory Umí opravovat vlastní chyby Umožňuje hostování webových aplikací Vhodné pro: Malé a střední projekty2. Cursor Funkce: Vznikl jako fork populárního editoru Podporuje vysokou produktivitu vývojářů Vhodný především pro zkušené kodéry Méně vhodný pro začátečníky nebo neprogramátory Vhodné pro: Seriózní vývoj aplikací3. Wrapifai Funkce: Ideální pro jednoduché nástroje a lead magnety Umí vytvořit aplikaci na základě jednoho promptu Pro složitější systémy nedostačuje Neomezený počet aplikací bez limitu na tokeny Vhodné pro: Rychlé generování funkčních miniaplikací4. Windsurf Funkce: Určen pro pokročilý vývoj Funguje jako agent s pamětí Disponuje webovým vyhledáváním a hlubokou analýzou (DeepSeek) Vhodné pro: Vysoká úroveň autonomie a flexibility při tvorbě aplikací5. GitHub Copilot Funkce: Jeden z prvních a nejpoužívanějších AI nástrojů Umí generovat kód, procházet a upravovat rozsáhlé codebase Podporuje práci s pull requesty a opravami chyb Vhodné pro: Stabilní nástroj integrovaný přímo v GitHub workflow6. Lovable Funkce: Rychle rostoucí evropský startup Nabízí integraci se Supabase Silná kombinace AI a no-code přístupu Vhodné pro: Tvorbu aplikací bez nutnosti hluboké znalosti kódu7. Bolt Funkce: Původně vedlejší projekt, nyní financovaný přes $100M Kombinuje vlastnosti nástrojů jako Softgen, Lovable a Windsurf Vhodné pro: Rychlou tvorbu prototypů a jednoduchých webů8. v0 Funkce: Skvělý pro návrh UI a design webových stránek Nepodporuje fullstack vývoj Umožňuje import z Figma a úpravy jednotlivých prvků Vhodné pro: Vizuální vývoj moderních webů9. Replit Funkce: Cloudové vývojové prostředí s AI integrací Nabízí živé sdílení kódu, deployment i AI asistenci Umožňuje rychlý start a prototypování bez složité konfigurace Vhodné pro: Začátečníky, týmy i výuku programování10. MarsX Funkce: Kombinuje přístup no-code, low-code a tradičního kódování Obsahuje marketplace s připravenými mikroaplikacemi Možnost integrace AI při stavbě aplikací Vhodné pro: Univerzální nástroj pro rychlou tvorbu projektů a MVP11. Claude Code Funkce: Umí analyzovat, vysvětlovat a navrhovat úpravy kódu Velmi silný v přirozeném jazyce a bezpečném vývoji Vývojový “nástroj” Anthropicu, velmi samostatně fungující Agent. Spouští se z příkazové řádky, ale neočekává se, že byste sami sahali do zdrojového kódu. Pro opravy, ladění a menší i střední projekty velmi dobrý, ale platí se za dotazy, takže může vyjít draho. Moje zkušenosti s ním zde. Vhodné pro: Práci s dokumentací, návrhy i analýzou Cenový model: Platí se za tokeny.12. Amazon Q Funkce: AI asistent s hlubokou integrací do AWS prostředí Pomáhá psát, ladit a nasazovat aplikace Nabízí návrhy architektury i kódu Vhodné pro: Vývojáře pracující s AWS13. Pear Funkce: AI nástroj pro párové programování Simuluje kolegu, který pomáhá s úkoly nebo strukturou kódu Podporuje vysvětlení i návrhy změn Vhodné pro: Učení i práci14. Devin Funkce: Agent schopný řídit vývojový proces Může plánovat úkoly, kódovat, testovat a iterovat Vhodné pro: Směřuje ke skutečnému „AI developerovi“15. GitHub Copilot Workspace Funkce: Nová generace Copilotu zaměřená na plánování a strukturování projektů Umožňuje konverzaci s kódem v reálném čase Vhodné pro: Start nového projektu nebo refaktoring Cenový model: Prémiový16. Google Project IDX Funkce: Cloudové IDE s AI asistencí pro full-stack a multiplatformní vývoj Podpora široké škály frameworků, jazyků a služeb Integrace s oblíbenými produkty Google Vhodné pro: Vývoj webových a mobilních aplikací Cenový model: Bezplatná verze s prémiovými funkcemi17. Webdraw Funkce: AI generátor UI komponent pro webové aplikace Převádí skici a popisy do kódu (HTML/CSS) Umožňuje rychlé prototypování uživatelských rozhraní Vhodné pro: Designéry a vývojáře bez hlubokých znalostí kódu Cenový model: Bezplatná verze s prémiovými funkcemi18. Tempo Funkce: AI pro řízení projektů a vývojových týmů Automatizuje plánování kapacit a optimalizaci zdrojů Integrace s Jira pro sledování času a výkonu Vhodné pro: Projektové manažery a vedení týmů Cenový model: Bezplatná zkušební verze s prémiovými funkcemi19. Cline Funkce: Terminálový AI asistent integrovaný do VS Code Schopnost vytvářet a upravovat soubory, spouštět příkazy a používat prohlížeč Zajišťuje bezpečnost a soukromí kódu Vhodné pro: Vývojáře hledajícího autonomního asistenta v IDE Cenový model: Open-source20. Continue Funkce: Open-source plugin pro VS Code a JetBrains Umožňuje vytvářet, sdílet a používat vlastní AI asistenty pro kódování Poskytuje chat, automatické doplňování a editaci kódu Vhodné pro: Vývojáře hledající přizpůsobitelné AI asistenty Cenový model: Bezplatný21. Databutton Funkce: AI vývojář pro netechnické uživatele Umožňuje vytvářet datově orientované aplikace s minimálním kódováním Poskytuje dlouhodobou paměť o aplikaci a rozhodnutích Vhodné pro: Vývoj i pokročilých webových aplikací, doporučuji vyzkoušet! Cenový model: Bezplatná verze s prémiovými funkcemi22. Base44 Funkce: AI agent pro budování interních nástrojů Umožňuje vytvářet vlastní software bez kódování Poskytuje nástroje pro monitorování interakcí a konfiguraci nastavení BASE44 - AI-Powered Software Development Vhodné pro: Firmy hledající rychlé řešení pro interní aplikace Cenový model: Bezplatná verze s prémiovými funkcemi23. Qodo Funkce: Generativní AI platforma zaměřená na kvalitu kódu Pomáhá psát, testovat a revidovat kód Nabízí automatizované code reviews a kontextové návrhy Qodo Vhodné pro: Vývojáře usilující o vysokou kvalitu kódu Cenový model: Prémiový24. Aider Funkce: AI párový programátor v terminálu Umožňuje spolupráci s velkými jazykovými modely (LLM) na úpravách kódu ve vašem lokálním git repozitáři Podporuje práci s existujícími projekty i vytváření nových Automaticky provádí commity s rozumnými zprávami Kompatibilní s modely jako GPT-4 a Claude 3.5 Sonnet Vhodné pro: Vývojáře hledající AI asistenci přímo v terminálu Cenový model: Open-source25. Co.dev Funkce: AI generuje Next.js a Supabase aplikace z textových promptů Cenový model: Bezplatná verze s prémiovými funkcemi26. Create.xyz Funkce: No-code tvůrce webových aplikací využívající AI pro generování z textu nebo obrázků Cenový model: Bezplatná verze s prémiovými funkcemi27. HeyBoss.xyz Funkce: AI konverzační generátor webových aplikací, stránek a her Cenový model: Prémiový28. Magically.life Funkce: AI generátor mobilních aplikací pro iOS a Android Cenový model: Prémiový29. Marblism Funkce: Platforma s více AI agenty, kteří společně vytvářejí webové aplikace Cenový model: Prémiový30. Memex Funkce: Umožňuje vytvářet cokoli v jakémkoli stacku pomocí přirozeného jazyka na vašem desktopu velmi autonomně a chytře fungující Cenový model: Bezplatná verze s prémiovými funkcemi, možnost dokoupit si kredity.31. Probz AI Funkce: No-code AI builder pro CRUD aplikace a interní nástroje Cenový model: Prémiový32. Smol Developer Funkce: Minimalistický AI agent pro rychlé generování kódu Cenový model: Bezplatný33. ToolJet Funkce: AI-enhanced low-code platforma pro interní nástroje Cenový model: Bezplatná verze s prémiovými funkcemiMarch 22, 2025
Nové funkce v Claude Code pro programování s AI
Svůj nástroj Claude Code pro “vibe coding” představil Anthropic vcelku nedávno a zjevně nad ním dosti intenzivně vyšívá. Tento týden Anthropic představil několik zajímavých nových funkcí, které vývojářům pomohou pracovat rychleji a efektivněji. Takže se na to pojďme podívat.
💡 Nevíte, co je Claude Code? Detailnější popis jsme si přinesli zde.
A co je nového?
1. Rozšířené myšlení (Extended thinking) 2. Vim mód 3. Vlastní slash příkazy 4. Zlepšená latence nástrojů 5. Režim auto-accept 6. Automatické doplňování cest k souborům 7. Auto-compact pro správu kontextu 8. Web fetch1. Rozšířené myšlení (Extended thinking)Claude Code nyní podporuje mód “rozšířeného myšlení”, který je poháněn modelem Claude 3.7 Sonnet. Stačí požádat Claude, aby “přemýšlel” (například příkazy “think”, “think more” nebo “think harder”), a aktivujete tuto schopnost.
Tip pro praxi: Nejprve informujte Claude o vašem úkolu a nechte ho získat kontext z vašeho projektu. Poté ho požádejte, aby “přemýšlel” a vytvořil plán. Intenzita přemýšlení se liší podle použitých slov - například “think hard” spustí intenzivnější proces přemýšlení než samotné “think”.
Tato funkce je zvláště užitečná pro větší úkoly vyžadující plánování, jako jsou refaktorizace kódu.
2. Vim módPro zkušené vývojáře, kteří rádi používají Vim, nabízí Claude Code novou funkci Vim módu. Použijte slash příkaz /vim k aktivaci insert/command módů pro úpravu promptů.
[image error]
3. Vlastní slash příkazyNyní si můžete vytvořit vlastní pracovní postupy (jako například “třídění GitHub issues”) přidáním souborů do adresářů .claude/commands/ nebo ~/.claude/commands/.
Vytvořte personalizované workflow, které lze kdykoliv vyvolat jako slash příkazy. Jednoduše přidejte Markdown soubory do těchto adresářů a obsah těchto souborů se stane novými příkazy.
Můžete vytvářet příkazy pro běžné workflow jako “kontrola pravopisu kódu” nebo “dotaz na Sentry logy a následně bisect ke git commitu”. Představte si je jako uložené postupy pro úkoly, které chcete provádět častěji.
Vlastní slash příkazy jsou v podstatě způsob, jak si vytvořit vaše vlastní přizpůsobené workflow nebo často používané instrukce, které můžete v Claude Code rychle vyvolat pomocí příkazu začínajícího lomítkem (/).
[image error]
Funguje to takto:
Vytvoření vlastního příkazu: Vytvořte Markdown soubor (soubor s příponou .md) Tento soubor umístěte do jednoho ze dvou adresářů: .claude/commands/ (lokální adresář v projektu) ~/.claude/commands/ (globální adresář ve vašem domovském adresáři) Struktura souboru: Název souboru určuje název příkazu. Například soubor pojmenovaný triage-issues.md vytvoří příkaz, který můžete vyvolat pomocí /triage-issues. Obsah souboru obsahuje instrukce nebo kroky, které chcete, aby Claude Code provedl. Použití příkazu: Když pracujete v Claude Code, jednoduše napíšete / následované názvem vašeho příkazu (bez přípony .md). Claude Code automaticky načte obsah příslušného souboru a provede instrukce v něm obsažené. Příklady možných použití: /triage-issues - Mohlo by zkontrolovat všechny otevřené GitHub issues, kategorizovat je podle priority a navrhnout akční plány. /code-review - Mohlo by provést automatickou kontrolu kódu podle vašich standardů. /deploy-checklist - Mohlo by projít seznam kontrolních bodů před nasazením. /analyze-logs - Mohlo by načíst a analyzovat logy z vašeho systému. /document-function - Mohlo by automaticky generovat dokumentaci pro vybranou funkci. Výhody: Ušetří čas při opakujících se úkolech Zajistí konzistenci při provádění běžných postupů Umožňuje sdílet užitečné workflow s týmem (pokud jsou v repozitáři projektu) Redukuje potřebu pamatovat si složité příkazy nebo postupyTyto vlastní příkazy jsou obzvláště užitečné pro opakující se úkoly specifické pro váš projekt nebo osobní workflow. Můžete je chápat jako “makra” nebo “automatizované skripty”, které Claude Code provede místo vás, ale s inteligencí a schopností adaptace AI asistenta.
4. Zlepšená latence nástrojůBěžné operace (včetně Git operací) jsou nyní mnohem svižnější, což zlepšuje celkový zážitek z používání.
5. Režim auto-acceptPoužijte Shift+Tab k zapnutí tohoto režimu, ve kterém Claude vytváří změny bez zastavování a žádání o povolení v každém kroku.
To je zvláště užitečné pro opakující se úlohy, kde Claude postupuje správným směrem. Vždy můžete režim auto-accept ukončit, pokud potřebujete konkrétní změnu důkladněji zkontrolovat.
6. Automatické doplňování cest k souborůmStiskněte Tab při psaní a Claude Code navrhne soubory/cesty k souborům odpovídající vašemu vstupu.
Jde o významné vylepšení kvality života při hledání souborů, které chcete explicitně odkazovat.
7. Auto-compact pro správu kontextuClaude Code automaticky kompaktuje historii konverzace při zachování důležitých informací, takže můžete pracovat na složitějších problémech bez obav o limity kontextu.
8. Web fetchVložte URL do Claude Code a on načte obsah z této webové stránky jako kontext.
[image error]
To je velmi užitečné pro omezení přepínání mezi Claude Code a prohlížečem. Tato funkce je ideální pro načítání dokumentace, specifikací nebo referenčních implementací bez nutnosti opustit terminál.
Všechny tyto funkce jsou dostupné nyní, stačí restartovat aplikaci, abyste měli jistotu, že používáte nejnovější verzi.
A pokud jste Claude Code ještě nenainstalovali, můžete ho stáhnout pomocí:
npm install -g @anthropic-ai/claude-codeClaude Code se stále vyvíjí a tým za ním slibuje v nadcházejících týdnech další nové funkce. S těmito vylepšeními se Claude Code stává ještě silnějším nástrojem pro vývojáře, kteří chtějí využít sílu AI při svém každodenním vývoji.
March 6, 2025
Surya Ganguli - Může se umělá inteligence vyrovnat lidskému mozku?
Přednáška neurovědce a stanfordského profesora Stanfordu Suryi Ganguliho s názvem „Can AI Match the Human Brain?“, která zazněla 22. října 2024 na konferenci TEDAI v San Franciscu.
Co se sakra stalo v oblasti umělé inteligence za posledních deset let? Jako by se na naší planetě objevil zvláštní nový typ inteligence, který se však lidské inteligenci nepodobá. Má pozoruhodné schopnosti, ale také dělá hrozivé chyby, kterých se my nikdy nedopouštíme. A zatím neumí hluboké logické uvažování, které umíme my. Má velmi záhadný povrch schopností i křehkostí a my téměř nic nechápeme o tom, jak funguje.
Chtěl bych hlubší vědecké poznání inteligence. Ale abychom umělou inteligenci pochopili, je užitečné zasadit ji do historického kontextu biologické inteligence.Příběh lidské inteligence mohl klidně začít tímto malým tvorečkem. Je to poslední společný předek všech obratlovců. Všichni jsme jeho potomky. Žil asi před 500 miliony let. Pak evoluce pokračovala a vytvořila mozek, který zase během 500 let, od Newtona po Einsteina, vyvinul hlubokou matematiku a fyziku potřebnou k pochopení vesmíru od kvarků po kosmologii. A to vše bez konzultace s ChatGPT.
A pak je tu samozřejmě pokrok posledního desetiletí. Abychom skutečně pochopili, co se právě stalo v oblasti umělé inteligence, musíme spojit fyziku, matematiku, neurovědu, psychologii, informatiku a další obory, abychom vyvinuli novou vědu o inteligenci. Tato věda o inteligenci nám může současně pomoci pochopit biologickou inteligenci a vytvořit lepší umělou inteligenci. A tuto vědu potřebujeme hned, protože inženýrství inteligence značně předstihlo naši schopnost jí porozumět.
Chtěl bych vás provést naší prací v oblasti vědy o inteligenci, která se zabývá pěti kritickými oblastmi, v nichž se může umělá inteligence zlepšit:
Efektivita dat Energetická účinnost Překročení evoluce Vysvětlitelnost Spojení mysli a strojůPojďme se postupně věnovat těmto kritickým nedostatkům.
Efektivita dat: Obrovský apetit umělé inteligenceUmělá inteligence je mnohem náročnější na data než lidé. Například naše jazykové modely nyní trénujeme na řádově bilionech slov. No a kolik slov dostaneme? Pouhých 100 milionů. To je ta malá červená tečka uprostřed. Možná ji ani nevidíte. Přečíst zbytek z jednoho bilionu slov by nám trvalo 24 000 let.Dobře, teď si možná řeknete, že to není fér. Jistě, umělá inteligence četla 24 000 let ekvivalentních lidským, ale lidé mají za sebou 500 milionů let vývoje mozku obratlovců. Ale má to háček. Celé dědictví evoluce je vám předáno prostřednictvím vaší DNA a vaše DNA má jen asi 700 megabajtů, tedy ekvivalentně 600 milionů slov. Takže kombinovaná informace, kterou získáme učením a evolucí, je mizivá ve srovnání s tím, co získá umělá inteligence. Všichni jste neuvěřitelně efektivní stroje na učení.
Jak tedy překleneme propast mezi AI a lidmi?
Tento problém jsme začali řešit tím, že jsme se vrátili ke slavným zákonům škálování. Zde je příklad škálovacího zákona, kde chyba klesá podle mocninného zákona s množstvím trénovacích dat. Tyto škálovací zákony zaujaly představivost průmyslu a motivovaly významné společenské investice do energie, výpočetní techniky a sběru dat.
Je tu však problém. Exponenty těchto škálovacích zákonů jsou malé. Takže abyste o něco snížili chybu, budete možná potřebovat desetinásobek množství trénovacích dat. To je dlouhodobě neudržitelné, a i když to krátkodobě vede ke zlepšení, musí existovat lepší způsob.
Vyvinuli jsme teorii, která vysvětluje, proč jsou tyto zákony škálování tak špatné. Základní myšlenka spočívá v tom, že velké náhodné soubory dat jsou neuvěřitelně redundantní. Pokud již máte miliardy datových bodů, další datový bod vám neřekne mnoho nového. Ale co kdybyste mohli vytvořit neredundantní soubor dat, kde by každý datový bod byl pečlivě vybrán tak, aby vám ve srovnání se všemi ostatními datovými body řekl něco nového?Vyvinuli jsme teorii a algoritmy, které to umožňují. Teoreticky jsme předpověděli a experimentálně ověřili, že tyto špatné mocninné zákony můžeme ohnout na mnohem lepší exponenciály, kde přidáním několika dalších datových bodů můžete snížit svou chybu, a ne desetinásobně zvětšit množství dat.
Jakou teorii jsme tedy použili, abychom dosáhli tohoto výsledku? Použili jsme myšlenky ze statistické fyziky a toto jsou rovnice. Po zbytek celé této přednášky budu tyto rovnice postupně probírat. Myslíte si, že si dělám legraci? A vysvětlím vám je.
Dobře, máte pravdu. Dělám si legraci. Nejsem tak zlý, ale měli jste vidět obličeje organizátorů TEDu, když jsem řekl, že to udělám.
Reimagining Machine LearningPojďme si to trochu přiblížit a zamyslet se obecněji nad tím, co je potřeba udělat, aby umělá inteligence nebyla tak náročná na data. Představte si, že bychom naše děti trénovali stejným způsobem, jakým předtrénujeme naše velké jazykové modely, tedy pomocí predikce dalšího slova. Takže bych svému dítěti dal náhodný kus internetu a řekl: Mimochodem, tohle je další slovo. Dal bych mu další náhodný kus internetu a řekl, ano, tohle je další slovo. Kdybychom dělali jen tohle, trvalo by našim dětem 24 000 let, než by se naučily něco užitečného.
Ale my děláme mnohem víc. Když například učím svého syna matematiku, učím ho algoritmus potřebný k vyřešení úlohy. Pak dokáže okamžitě řešit nové problémy a zobecňovat s použitím mnohem méně tréninkových dat, než by zvládl jakýkoli systém umělé inteligence. Nepředkládám mu miliony matematických úloh.
Abychom umělou inteligenci skutečně zefektivnili z hlediska dat, musíme jít daleko za hranice našich současných tréninkových algoritmů a přeměnit strojové učení na novou vědu o strojovém učení. A tady nám opravdu může pomoci neurověda, psychologie a matematika.
Energetická účinnost: 20wattový mozek vs. umělá inteligencePřejděme k dalšímu velkému rozdílu, k energetické účinnosti. Naše mozky jsou neuvěřitelně efektivní. Spotřebováváme pouze 20 wattů energie. Pro srovnání, naše staré žárovky měly příkon 100 wattů. Všichni jsme tedy doslova slabší než žárovky.
Ale co umělá inteligence? Trénování velkého modelu může spotřebovat až 10 milionů wattů a mluví se o jaderné energetice pro datová centra s výkonem 1 miliardy wattů.
Proč je tedy umělá inteligence o tolik náročnější na energii než mozek? Inu, na vině je samotná volba digitálního výpočtu, kdy se spoléháme na rychlé a spolehlivé převracení bitů v každém mezikroku výpočtu. Nyní termodynamické zákony vyžadují, aby každé rychlé a spolehlivé přehození bitů spotřebovalo hodně energie.
Biologie se vydala zcela jinou cestou. Biologie počítá správnou odpověď právě včas pomocí mezikroků, které jsou co nejpomalejší a nejnespolehlivější. Biologie v podstatě netočí svůj motor více, než je nutné.Kromě toho biologie mnohem lépe přizpůsobuje výpočet fyzikálním zákonům. Vezměme si například sčítání. Naše počítače sčítají pomocí opravdu složitých, energeticky náročných tranzistorových obvodů, ale neurony prostě přímo sčítají svá vstupní napětí, protože Maxwellovy zákony elektromagnetismu již vědí, jak sčítat napětí. Biologie v podstatě přizpůsobuje své výpočty přirozené fyzice vesmíru.
Abychom tedy skutečně vytvořili energeticky úspornější umělou inteligenci, musíme přehodnotit celý náš technologický zásobník od elektronů po algoritmy a lépe sladit výpočetní dynamiku s fyzikální dynamikou. Jaké jsou například základní limity rychlosti a přesnosti jakéhokoli daného výpočtu vzhledem k energetickému rozpočtu? A jaké druhy elektrochemických počítačů mohou těchto základních limitů dosáhnout?
Nedávno jsme tento problém vyřešili pro výpočet snímání, což je něco, co musí dělat každý neuron. Podařilo se nám najít základní dolní meze nebo dolní limity chyby jako funkce energetického rozpočtu, to je ta červená křivka. A podařilo se nám najít chemické počítače, které těchto mezí dosahují. A pozoruhodné je, že se velmi podobaly receptorům spřaženým s G-proteiny, které každý neuron používá k vnímání vnějších signálů. To tedy naznačuje, že biologie může dosáhnout takové účinnosti, která se blíží základním limitům stanoveným samotnými fyzikálními zákony.
Neurověda nám nyní dává možnost měřit nejen nervovou aktivitu, ale také spotřebu energie například v celém mozku mouchy. Spotřeba energie se měří pomocí spotřeby ATP, což je palivo, chemické palivo, které pohání všechny neurony.
Nyní mi dovolte položit vám otázku. Řekněme, že v určité oblasti mozku se zvýší nervová aktivita. Stoupá nebo klesá množství ATP? Přirozený odhad by byl, že ATP klesá, protože nervová aktivita stojí energii, takže musí spotřebovávat palivo. My jsme zjistili přesný opak. Když nervová aktivita stoupá, ATP stoupá a zůstává zvýšená právě tak dlouho, aby mohla pohánět očekávanou budoucí nervovou aktivitu. To naznačuje, že mozek se řídí principem prediktivní alokace energie, kdy dokáže předvídat, kolik energie je kde a kdy potřeba, a dodává správné množství energie na správné místo po správnou dobu.
Je tedy zřejmé, že se máme co učit z fyziky, neurovědy a biologie, abychom mohli vytvořit energeticky účinnější systémy umělé inteligence.
Nemusíme se nechat omezovat evolucí. Můžeme jít nad rámec evoluce a kooptovat neuronové algoritmy objevené evolucí, ale implementovat je do kvantového hardwaru, na který evoluce nikdy nepřijde. Můžeme například nahradit neurony atomy. Různé stavy vypalování neuronů odpovídají různým elektronickým stavům atomů a synapse můžeme nahradit fotony. Stejně jako synapse umožňují komunikaci dvou neuronů, fotony umožňují komunikaci dvou atomů prostřednictvím emise a absorpce fotonů.
Co z toho můžeme vytvořit? Z atomů a fotonů můžeme vytvořit kvantovou asociativní paměť. Jedná se o stejný paměťový systém, který Johnu Hopfieldovi vynesl nedávnou Nobelovu cenu za fyziku, tentokrát se však jedná o kvantově mechanický systém sestavený z atomů a fotonů, a my můžeme analyzovat jeho výkonnost a ukázat, že kvantová dynamika přináší zvýšenou kapacitu paměti, robustnost a zapamatování.
Můžeme také vytvořit nové typy kvantových optimalizátorů postavených přímo z fotonů a můžeme analyzovat jejich energetickou krajinu a vysvětlit, jak řeší optimalizační problémy zásadně novým způsobem. Toto spojení neuronových algoritmů a kvantového hardwaru otevírá zcela novou oblast, kterou bych rád nazval kvantové neuromorfní výpočty.
Využití vysvětlitelné umělé inteligence k pochopení mozkuVraťme se k mozku, kde nám vysvětlitelná umělá inteligence může pomoci pochopit, jak funguje. Umělá inteligence nám umožňuje vytvářet neuvěřitelně přesné, ale složité modely mozku. Kam to všechno směřuje? Nahrazujeme prostě něco, čemu nerozumíme, mozek, něčím jiným, čemu nerozumíme, naším složitým modelem? Jako vědci bychom chtěli mít konceptuální porozumění tomu, jak mozek funguje, ne jen to, že nám tento model někdo předá.
Rád bych vám uvedl příklad naší práce v oblasti vysvětlitelné umělé inteligence aplikované na sítnici. Sítnice je vícevrstvý obvod fotoreceptorů, které jdou ke skrytým neuronům, jež jdou k výstupním neuronům. Jak to funguje? Nedávno jsme vytvořili nejpřesnější model sítnice na světě. Dokázal reprodukovat dvě desetiletí experimentů se sítnicí. To je fantastické. Máme digitální dvojče sítnice, ale jak toto dvojče funguje? Proč je navrženo tak, jak je?Abych tyto otázky konkretizoval, rád bych probral jen jeden z experimentů, z těch dvou desetiletí experimentů, o kterých jsem se zmínil. Chtěl bych, abyste všichni, a tento experiment na vás provedeme právě teď. Chtěl bych, abyste se zaměřili na mou ruku a sledovali ji. Uděláme to ještě jednou. Možná jste byli mírně překvapeni, když moje ruka změnila směr, a měli byste být překvapeni, protože moje ruka právě porušila první Newtonův pohybový zákon, který říká, že předměty, které jsou v pohybu, mají tendenci zůstat v pohybu.
Kde ve vašem mozku se porušení prvního Newtonova zákona objevilo jako první? Odpověď je pozoruhodná. Je to ve vaší sítnici. Ve vaší sítnici jsou neurony, které se spustí pouze a jedině v případě, že je porušen první Newtonův zákon. Dělá to tedy náš model? Ano, dělá to. Reprodukuje ho. Ale teď je tu hádanka. Jak to model dělá?
Vyvinuli jsme metody, vysvětlitelné metody umělé inteligence, abychom mohli vzít jakýkoli podnět, který způsobí, že neuron začne hořet, a vyčlenili jsme základní podokruh odpovědný za toto hoření a vysvětlili, jak funguje. To se nám podařilo nejen u porušení prvního Newtonova zákona, ale i u dvou desetiletí experimentů, které náš model reprodukoval.
Tím se otevírá nová cesta k urychlení objevů v neurovědách pomocí umělé inteligence. V podstatě jde o to vytvořit digitální dvojčata mozku a pak pomocí vysvětlitelné AI pochopit, jak fungují. Ve Stanfordu se právě zabýváme velkým úsilím o vytvoření digitálního dvojčete celého zrakového systému primátů a vysvětlení jeho fungování.
Spojení mysli a strojůMůžeme jít ještě dál a využít naše digitální dvojčata ke splynutí myslí a strojů tím, že mezi nimi umožníme obousměrnou komunikaci. Představte si scénář, kdy máte mozek, pořídíte z něj záznam, sestavíte digitální dvojče a pak se pomocí teorie řízení naučíte vzorce nervové aktivity, které můžete zapsat přímo do digitálního dvojčete a ovládat ho. Pak vezmete tytéž vzory nervové aktivity a zapíšete je do mozku, abyste ho mohli ovládat. V podstatě se můžeme naučit jazyk mozku a pak s ním přímo mluvit.
Nedávno jsme tento program realizovali na myších, kde jsme mohli pomocí umělé inteligence číst myšlenky myši. V horním řádku vidíte obrázky, které jsme myši skutečně ukázali. A ve spodní řadě vidíte obrázky, které jsme dekódovali z mozku myši. Naše dekódované obrázky mají nižší rozlišení než skutečné obrázky, ale ne proto, že by naše dekodéry byly špatné. Je to proto, že vizuální rozlišení myši je špatné. Takže dekódované obrázky vám vlastně ukazují, jak by svět ve skutečnosti vypadal, kdybyste byli myší.
Nyní můžeme jít dál. Nyní můžeme do mozku myši zapsat vzorce nervové aktivity, takže ji můžeme přimět k halucinaci jakéhokoli konkrétního vjemu, který bychom chtěli, aby halucinovala. A jsme v tom tak dobří, že ji dokážeme spolehlivě přimět k halucinaci vjemu tím, že ovládáme pouze 20 neuronů v myším mozku, a to tak, že zjistíme, kterých 20 neuronů je třeba ovládat. V podstatě můžeme přímo řídit to, co myš vidí, tím, že do jejího mozku zapíšeme.Možnosti obousměrné komunikace mezi mozkem a stroji jsou neomezené, aby bylo možné mozek pochopit, léčit a rozšířit.
Jednotná věda o inteligenciDoufám, že pochopíte, že snaha o jednotnou vědu o inteligenci, která zahrnuje mozky a stroje, nám může pomoci jak lépe pochopit biologickou inteligenci, tak vytvořit efektivnější, vysvětlitelnější a výkonnější umělou inteligenci. Je však důležité, aby toto úsilí probíhalo otevřeně, aby se o tuto vědu mohl podělit celý svět, a musí probíhat ve velmi dlouhém časovém horizontu.
Díky tomu je akademická sféra ideálním místem, kde se vědě o inteligenci věnovat. V akademické sféře jsme osvobozeni od tyranie čtvrtletních výkazů zisků. Jsme osvobozeni od cenzury právních oddělení firem. Můžeme být mnohem interdisciplinárnější než kterákoli společnost a naším samotným posláním je sdílet se světem to, co se naučíme.
Ze všech těchto důvodů vlastně budujeme na Stanfordu nové centrum pro vědu o inteligenci. Zatímco v průmyslu došlo k neuvěřitelným pokrokům v oblasti inženýrství inteligence, které se nyní stále častěji odehrávají za zavřenými dveřmi, jsem velmi nadšený z toho, čeho může věda o inteligenci dosáhnout na otevřeném prostranství.
V minulém století spočívalo jedno z největších intelektuálních dobrodružství v tom, že lidstvo nahlíželo do vesmíru, aby mu porozumělo, od kvarků po kosmologii. Myslím, že jedno z největších intelektuálních dobrodružství tohoto století bude spočívat v tom, že lidstvo bude nahlížet dovnitř, a to jak do sebe, tak do umělé inteligence, kterou vytvoříme, abychom dosáhli hlubšího, nového vědeckého pochopení inteligence.
Děkuji.
March 5, 2025
Může Eutelsat nahradit na Ukrajině Starlink?
Musk se rozhodl přitlačit na vydírání Ukrajiny a hrozí vypnutím Starlinku. Již podruhé. Naštěstí se již přes rok pracuje na záložním řešením, jímž může být Eutelsat. Nebude dokonalé, ale bude pro řadu případů dostatečné. Pojďme se na to podívat.
Eutelsat a OneWeb jsou nyní součástí jedné společnosti, která vznikla jejich fúzí v roce 2023. Zde je stručná historie:
Historie Eutelsat
Založen v roce 1977 jako evropská mezivládní organizace pro satelitní komunikaci V roce 2001 se transformoval na soukromou společnost V roce 2005 vstoupil na burzuHistorie OneWeb
Založen v roce 2012 pod názvem WorldVu V roce 2019 vypustil první satelity V roce 2020 vyhlásil bankrot, následně byl zachráněn investicí britské vlády a indické společnosti Bharti GlobalFúze Eutelsat a OneWeb byla oznámena v červenci 2022 a dokončena 28. září 2023. Vznikla nová společnost “Eutelsat Group” s dvěma hlavními dceřinými společnostmi - Eutelsat a Eutelsat OneWeb. Hlavními akcionáři jsou francouzská a britská vláda, každá s přibližně 10% podílem. Další významní akcionáři zahrnují Bharti Global, Bpifrance a Hanwha Group. Společnost je veřejně obchodována na burze
Technologické porovnáníPokrytí signálem:
🛰️ Eutelsat/OneWeb: Po fúzi s OneWebdisponuje Eutelsat přibližně 630 satelity na nízké oběžné dráze Země (LEO), které pokrývají Evropu, včetně Ukrajiny.
♨️ Starlink: Provozuje více než 7 000 satelitů na LEO, což mu umožňuje globální pokrytí, včetně Ukrajiny.
Kapacita sítě a přenosová rychlost:
🛰️ Eutelsat/OneWeb: Nabízí přenosové rychlosti až 150 Mb/s.
♨️ Starlink: Poskytuje rychlosti stahování až 200 Mb/s.
Kvalita a latence datových přenosů:
🛰️ Eutelsat/OneWeb: Díky umístění satelitů na LEO nabízí nižší latenci ve srovnání se satelity na geostacionární dráze.
♨️ Starlink: Dosahuje latence mezi 20 a 40 ms, což je srovnatelné s pozemními připojeními.
Terminály Eutelsatu jsou navrženy pro podnikové a vládní použití, jsou větší a méně přenosné. Ukrajina pracuje na kompaktní verzi. Terminály Starlinku jsou kompaktní a snadno přenosné, což umožňuje rychlé nasazení v terénu. I tak ale zpravidla potřebují rozměrnější anténu.
Možnost použití v dálkových dronech pronikajících hluboko do ruského týlu:
🛰️ Eutelsat/OneWeb: Díky nižší latenci a stabilnímu připojení by mohl podporovat komunikaci s drony, avšak větší velikost terminálů může omezit jejich integraci do menších dronů.
♨️ Starlink: Kompaktní terminály umožňují integraci do různých typů zařízení, ale ani současná nejmenší verze Starlinku není vhodná pro přímou integraci do dronů.
Tady je potřeba dodat, že o tom, jakým způsobem komunikují dálkové drony s centrálou, se logicky mnoho neví. Předpokládá se, že se používají zmenšené terminály, ale datová kapacita nebude vysoká, rozhodně se neobjevují žádná videa z těchto dronů a tak je třeba uvažovat o tom, že dnes se Starlink (i kvůli rozměrné anténě) pro spojení s dálkovými drony nepoužívá. Ano, některé mobilní telefony mají možnost používat Starlink přenosy, což naznačuje možnou miniaturizaci, ale tato možnost je za podmínek otevřeného nebe (drony splňují) a velmi nízké přenosové kapacity. Věrohodně ovšem víme pramálo.
Eutelsat, po fúzi s OneWeb, představuje životaschopnou alternativu ke Starlinku na Ukrajině. Nicméně, vzhledem k větší velikosti terminálů a vyšším nákladům může být jeho nasazení omezené, zejména v mobilních a taktických aplikacích, jako je integrace do dronů. Starlink nabízí výhodu v podobě kompaktnějších terminálů a širšího pokrytí, což je klíčové pro flexibilní vojenské operace.
March 3, 2025
Srovnání systémů GPS a Galileo pro vojenské účely
Galileo je evropský globální družicový navigační systém vytvořený jako nezávislá alternativa k americkému GPS. Hlavním cílem bylo zajistit pro Evropu vlastní vysoce přesný navigační systém, aby evropské autority (včetně armády) nemusely spoléhat na cizí systémy, které mohou jejich provozovatelé v krizové situaci omezit či vypnout. Toto téma se stalo v minulých dnech velmi aktuální. A proto je důležitá otázka: lze systémem Galileo nahradit americké GPS ve vojenském použití?
Podívejme se na základní parametry. Vycházím z veřejně dostupných zdrojů, neměl jsem přístup k žádným vojenským utajovaným informacím, takže některé informace nemohou být samozřejmě zodpovězeny, ale obecný obrázek si lze udělat.
Přesnost a spolehlivostGalileo dosahuje obecně vyšší nominální přesnosti než starší GPS. Odhaduje se, že Galileo má horizontální přesnost pod 1 metrem, zatímco u GPS je to kolem 3 metrů (pro otevřené civilní služby, bez dalších korekcí). Tento rozdíl je dán modernější konstrukcí systému Galileo – využívá více frekvencí na všech satelitech (pásma E1, E5, E6), což umožňuje lepší korekci ionosférických chyb a přesnější synchronizaci času. Navíc Galileo od počátku neomezuje dostupnou přesnost pro civilní uživatele (nemá obdobu dřívějšího záměrného zhoršování přesnosti Selective Availability u GPS). V praxi tedy i neautorizovaní uživatelé Galilea mohou dosáhnout metrové a nově i decimetrové přesnosti (Galileo od roku 2023 poskytuje službu High Accuracy Service s ~20 cm přesností zdarma) – takové údaje byly dříve vyhrazeny jen pro armádu. GPS modernizace (zavádění signálu L5 a pokročilých satelitů Bloku III) však také zlepšuje přesnost a do značné míry rozdíl stírá.
Spolehlivost GalileaSystém GPS má za sebou desítky let provozu s minimem výpadků – od plného zprovoznění v 90. letech poskytuje nepřetržitou globální službu s vysokou dostupností. Naproti tomu Galileo je provozně mladší (zahájil počáteční služby v roce 2016) a v počátcích provozu čelil problémům. Nejzávažnější byl globální výpadek Galilea v červenci 2019, kdy v důsledku anomálie v pozemním časovacím centru byly všechny družice mimo provoz po dobu zhruba jednoho týdne. Během této doby byly uživatelé varováni, že signál nemá být používán, což podkopalo důvěru v spolehlivost systému. Příčina byla identifikována v závadě pozemní infrastruktury (Precise Timing Facility) a provozovatelé následně zahájili revizi redundance systému. Od té doby byla spolehlivost Galilea výrazně zvýšena. Počet aktivních družic vzrostl a dosáhl plného operačního stavu (FOC) okolo roku 2020 s ~26 satelity na oběžné dráze . Aktuálně (dle dat z přelomu 2024/2025) je v provozu 24–26 satelitů a probíhá vypouštění dalších, aby se dosáhlo plánovaných 30 družic pro plnou kapacitu. Také výkonnostní ukazatele Galilea již stabilně plní nebo překračují stanovené cíle – například odchylka signálu (SIS Error) se u dual-frequency přijímačů drží hluboko pod cílovou hodnotou 2 m . Lze tedy říci, že přesnost obou systémů je pro vojenské účely srovnatelná (obě mohou dosahovat sub-metrové či lepší přesnosti s patřičným vybavením) a spolehlivost GPS je zatím historicky ověřenější, avšak Galileo podniká zásadní kroky k dorovnání (např. plně redundantní řídicí centra, viz níže).
Odolnost vůči rušení a kybernetickým hrozbámRušení signálu (jamming) a spoofing: Signály GNSS vysílané z družic mají velmi nízký výkon na úrovni Země, a proto jsou citlivé na úmyslné rušení (jamming) i podvržení signálu (spoofing). Moderní vojenské signály GPS i Galilea na tuto hrozbu reagují několika způsoby. Galileo nabízí službu PRS (Public Regulated Service) – tj. šifrovaný, regulovaný signál pro vládní a vojenské uživatele – který je navržen tak, aby odolal rušení a spoofingu. PRS signál využívá široké frekvenční pásmo a vyšší výkon než otevřený civilní signál, a díky tomu je podstatně odolnější vůči rušení – k jeho vyřazení by bylo potřeba nasadit velmi výkonné a nákladné rušičky, které lze snáze odhalit. To výrazně snižuje pravděpodobnost úspěšného zarušení autorizované navigace Galileo v bojových podmínkách. Stejně tak je PRS odolný proti spoofingu – modulace signálu a jeho šifrování znesnadňují generování falešného navigačního signálu, který by přijímač akceptoval.
GPS pro vojenské účely tradičně využívá P(Y) kód a nově zaváděný M-kód. M-kód GPS byl navržen právě s důrazem na odolnost vůči rušení a klamání – má vyšší výkon, širší pásmo a moderní modulaci. Uživatelům poskytne dedikovaný vojenský signál oddělený od civilního, s lepší obranou proti jammingu a schopností detekovat/spolehlivě odmítnout podvržené signály. Satelity GPS nové generace (Block III) s M-kódem zvyšují odolnost proti rušení i celkovou integritu a přesnost systému. Prakticky tedy oba systémy (GPS s M-kódem i Galileo s PRS) využívají pokročilé technologie proti NAVWAR hrozbám, jako jsou anténní filtry a směrové antény na přijímačích, zabezpečená modulace signálu a autentizace dat.
Kybernetická bezpečnost: Kromě samotného rádiového rušení je důležitá i ochrana řídicích systémů a infrastruktury před kybernetickými útoky. GPS je provozován Ministerstvem obrany USA, které neustále modernizuje řídicí segment (např. nový systém OCX) s cílem zvýšit bezpečnost, odolnost a imunitu vůči kybernetickým hrozbám. Galileo je spravován civilní agenturou EU (EUSPA) a jeho pozemní segment zahrnující dvě hlavní řídicí střediska (Německo, Itálie) a síť monitorovacích stanic po světě byl po výpadku 2019 modernizován pro plnou redundanci a lepší zabezpečení. Probíhá nasazení bezpečnostních monitorovacích center a celkové posílení IT infrastruktury Galilea (virtualizace, pružné softwarové aktualizace) tak, aby výpadek jednoho centra neohrozil celý systém. Dále Galileo zavádí i autentizaci navigačních zpráv pro otevřenou službu (OS-NMA), což ztěžuje nepříteli podvrhnout falešná data do signálu. Z hlediska kybernetické odolnosti si tak Galileo po počátečních potížích rychle buduje srovnatelnou úroveň ochrany jako GPS. Pro vojenské uživatele to znamená, že důvěryhodnost a nedotknutelnost dat (PNT informací) z obou systémů je vysoká.
Šifrování a bezpečnost vojenských signálůGalileo PRS: Vojenské (regulované) signály Galilea jsou důsledně šifrovány. Přístup k nim je povolen pouze autorizovaným uživatelům (členské státy EU a případně schválení partneři) a řízení přístupu je zajištěno kryptografickými klíči. Bez příslušných utajených klíčů není možné z PRS signálu získat žádné informace . Každý členský stát EU si spravuje distribuci klíčů svým uživatelům prostřednictvím národního PRS orgánu, přičemž existují přísné společné standardy bezpečnosti. Samotné přijímače PRS obsahují bezpečnostní moduly (hardwarové „black boxy“) odolné proti manipulaci či zpětnému inženýrství. Kryptografická síla PRS a jeho autentizační mechanismy zajišťují, že podvržení signálu (spoofing) je dosti obtížné (ačkoliv pro kvantové počítače ne nepřekonatelné, nejde o post-kvantové šifry) – nepřítel by musel prolomit vojenské šifrování nebo odcizit klíče, což je bez kvantového počítače prakticky nemožné. Signál PRS rovněž umožňuje autentizovat polohu a čas uživatele (přijímač si může ověřit, že údaje skutečně pochází od družic a ne z falešného zdroje). To je zásadní pro vojenské operace, kde se spoléhá na integritu dat.
GPS (P(Y) a M-kód): Americký GPS má pro armádu obdobně zabezpečené signály. Starší P(Y) kód (na frekvencích L1 a L2) je šifrovaný a přístupný pouze vybavení se speciálním modulem (SAASM) a platnými klíči. Novější M-kód představuje vylepšení – zavádí modernější šifrovací algoritmus MNSA a celkově pružnější kryptografickou architekturu. M-kód je navržen tak, aby vytvářel neprostupný zabezpečený kanál mezi satelitem a přijímačem. Odborníci uvádějí, že je prakticky nemožné tento signál spolehlivě spoofovat či imitovat. M-kód také zvýší nezávislost vojenských uživatelů na civilním signálu – jakmile bude plně zaveden, armády využívající M-kód nebudou ohroženy případným vypnutím civilního GPS signálu (např. ze strany USA v rámci opatření NAVWAR) . Z hlediska kryptografické bezpečnosti jsou si tedy GPS (M-kód) a Galileo (PRS) ekvivalentní – oba poskytují důvěryhodný, utajený servis pro autorizované vojenské uživatele. Rozdíl je v kontrole nad šifrováním: Galileo PRS dává evropským státům plnou suverenitu nad klíči a provozem (klíče generuje a spravuje EU a státy, pro Česko NÚKIB), zatímco u GPS signálů má ultimátní kontrolu USA (spojenci v NATO sice dostávají přístup, ale závisejí na americké infrastruktuře). Pro Evropu tak PRS představuje strategickou výhodu v podobě nezávislosti: nemůže být vypnut cizí mocností, pokud má Evropa své satelity a klíče .
Pokrytí a dostupnost signáluCelosvětové pokrytí: Oba systémy jsou koncipovány jako globální a využívají střední oběžnou dráhu (MEO) s družicemi rozmístěnými tak, aby kdekoliv na Zemi bylo neustále viditelné dostatečné množství satelitů (minimálně 4 pro určení polohy). GPS toho dosahuje pomocí ~31 aktivních družic (zpravidla 24 hlavních + několik rezervních) na šesti orbitech se sklonem ~55°. Galileo cílí na souhvězdí 30 družic na třech drahách se sklonem ~56° . V současnosti Galileo disponuje cca 24 aktivními satelity, což mu již umožňuje téměř plné pokrytí – od roku 2019/2020 je deklarován jako Full Operational Capability s globálním dosahem. Plné doplnění satelitů na plánovaných 30 (včetně náhradních) probíhá. Nové satelity se vypouštějí v dávkách (např. dalších 12 kusů tzv. Batch 3) . Již s 24+ družicemi však Galileo pokrývá všechny kontinenty a široké okolí. Z hlediska geografického dosahu tedy Galileo může plnohodnotně nahradit GPS – obě konstelace nabízejí globální pokrytí včetně vysokých zeměpisných šířek (s ohledem na dráhy do ~75° s. š./j. š.). Mimochodem, družice vynášel dříve Sojuz, tedy Rusko, od začátku konfliktu na Ukrajině se plně přešlo mimo nosiče Sojuz, z části na Falcon 9 společnosti SpaceX a Ariane 5, nadále se počítá s využíváním Ariane 6. Přehled startů a satelitů je zde.
Dostupnost signálu: GPS i Galileo jsou navrženy tak, aby poskytovaly vysokou dostupnost (availability) a neustálý servis. GPS deklaruje dostupnost přes 99% a Galileo má podobné cíle. V praxi dostupnost závisí na udržení dostatečného počtu funkčních satelitů a pravidelné aktualizaci navigačních dat. GPS jako zavedený systém má robustní režim údržby – zastarávající satelity jsou průběžně nahrazovány novými “bloky”, výpadek jednotlivých družic neohrožuje službu díky redundanci. Galileo jako novější systém se stále doplňuje, ale rovněž počítá s rezervami a pravidelnou obměnou (již se plánuje druhá generace satelitů po roce 2026) . Díky menšímu počtu satelitů měl Galileo zpočátku chvílemi omezenější dostupnost signálu (např. v některých oblastech méně satelitů nad obzorem současně), ale tento handicap se s plným operačním stavem vytrácí. Galileo rovněž zavedl opatření pro případy, kdy by otevřené služby GNSS musely být dočasně vypnuty z bezpečnostních důvodů – autorizovaným uživatelům PRS by zůstal funkční chráněný signál, aby byla zachována kontinuita PNT služeb. Celkově lze konstatovat, že Galileo nyní poskytuje srovnatelnou úroveň pokrytí a dostupnosti jako GPS. Při čistě vojenském využití (kdy přijímače budou naladěny na všechny dostupné družice Galileo) by tedy neměl nastat deficit v pokrytí oproti GPS.
Závislost na infrastruktuřeSatelitní segment: Náhrada GPS Galileem znamená spoléhat se na evropskou orbitální infrastrukturu. To obnáší nutnost udržovat dostatečný počet funkčních satelitů na dráze a jejich pravidelné servisní obnovy. USA investují do GPS nepřetržitě (např. program GPS III a IIIF zajistí nové satelity na další desetiletí). Podobně EU bude muset zajišťovat financování a vypouštění Galileo satelitů, aby systém dlouhodobě fungoval. Technicky je satelitní segment Galilea velmi kvalitní – satelity mají vysoce přesné atomové hodiny (včetně vodíkových maserů) a redundanci systémů pro dlouhou životnost. Několik počátečních satelitů Galilea sice trpělo závadami hodin, avšak díky čtyřnásobné redundanci na palubě nebyl provoz zásadně ohrožen. Satelity GPS a Galileo mají podobnou deklarovanou životnost (~12 let), takže obnova flotily je srovnatelnou výzvou pro oba provozovatele. Pro uživatele však tato závislost znamená hlavně to, že Evropa musí sama zajistit chod systému, na rozdíl od dřívějšího spoléhání na americkou infrastrukturu. V krizové situaci by ovšem Evropa díky tomu měla jistotu, že signál nemůže být cizím státem záměrně zhoršen či vypnut.
Pozemní segment: Každý GNSS potřebuje rozsáhlou pozemní infrastrukturu pro řízení družic a přesnou synchronizaci času. GPS je řízen z hlavního operačního střediska na základně Schriever (USA) s podpůrným střediskem v Kalifornii;. Má síť monitorovacích stanic rozmístěných po světě (včetně například Havaje, Ascension, Diego Garcia atd.), které nepřetržitě sledují satelity a uplinkují korekce jejich drah a hodin. Galileo má dvě hlavní řídicí centra v Evropě (Oberpfaffenhofen v Německu a Fucino v Itálii) a globální síť cca 40 monitorovacích stanic (GSS) rozmístěných od Evropy, přes zámořská území (Guyana, Martinik) po Oceánii. Tato centra a stanice zajišťují uplink navigačních dat na družice a monitoring jejich stavu. Zranitelnost infrastruktury spočívá v tom, že porucha nebo útok na klíčové prvky může ovlivnit fungování systému – což se projevilo u Galilea v roce 2019 (problém časového centra vyřadil celý systém). Proto nyní dochází k posilování redundance: budují se duální kontrolní kapacity, záložní systémy a zlepšuje kybernetické zajištění . GPS již historicky podobné zálohy má, a nikdy nedošlo k úplnému selhání celého systému způsobenému výpadkem řízení. Pro vojenské uživatele nahrazení GPS Galileem tedy znamená přechod na evropskou podpůrnou infrastrukturu – ta je dnes schopná plnit obdobné funkce, ale vyžaduje stálou pozornost EU (technickou i finanční). Závislost na vlastní infrastruktuře je ovšem strategicky vítaná, neboť eliminuje dřívější politickou závislost na infrastruktuře cizí mocnosti.
Interoperabilita s dalšími GNSSGalileo byl od počátku navržen tak, aby spolupracoval s dalšími GNSS systémy. Je vysílán na frekvencích částečně sladěných s GPS (např. pásmo Galileo E1 odpovídá GPS L1, E5a odpovídá L5), což usnadňuje konstrukci vícesystémových přijímačů. V navigační zprávě Galileo dokonce přímo vysílá údaje o rozdílu svého času vůči UTC a GPS času, aby příjemce mohl snadno kombinovat měření z GPS i Galilea . V současnosti většina moderních vojenských přijímačů PNT bude pravděpodobně multi-GNSS – schopná přijímat jak GPS, tak Galileo (případně i další systémy). To umožní využívat nejlepší vlastnosti obou: vyšší počet satelitů na obloze zlepšuje přesnost a odolnost (při rušení může přijímač hledat signál z více zdrojů) . Pro uživatele NATO to znamená, že Galileo nemusí fungovat izolovaně – naopak, kombinace GPS a Galileo je velmi výhodná. Studie uvádějí, že uživatelé vojenského GPS signálu mohou zásadně profitovat z přidání Galilea (PRS) v kombinaci, která zvýší robustnost a kontinuitu služby i za ztížených podmínek. Například pokud by protivník dokázal lokálně rušit pásmo jedné konstelace, přijímač využívající více GNSS může nadále navigovat díky druhé konstelaci. Dnes je zcela běžné, že čipsety pro navigační přijímače se vyrábějí s podporou více systémů.
Interoperabilita se týká i dalších GNSS – Galileo je plně kompatibilní s mezinárodními standardy, takže jej lze používat spolu s ruským GLONASS či čínským BeiDou (ačkoliv z politických a bezpečnostních důvodů by evropští vojáci asi preferovali kombinaci se spojeneckým GPS). V praxi tedy náhrada GPS Galileem nevylučuje souběžné využití obou systémů. Naopak, nejpravděpodobnější scénář vojenského využití do budoucna je ten, že přijímače budou využívat Galileo jako primární zdroj PNT s možností záložního GPS (či naopak), čímž se výrazně zvýší odolnost celkové navigační schopnosti. Navíc Galileo díky své nezávislosti poskytuje pojistku – v případě, že by jedna ze systémových infrastruktur (americká či evropská) byla z jakýchkoli důvodů kompromitována, stále je tu druhý systém.
ZávěrZ technického hlediska Galileo dospělo do fáze, kdy může plnohodnotně sloužit vojenským účelům a v klíčových parametrech se vyrovná GPS. Nabízí vysokou přesnost, globální pokrytí, zabezpečené šifrované signály a rostoucí odolnost proti rušení a útokům. Nahrazení GPS systémem Galileo by tedy bylo technicky možné, zejména pro evropské ozbrojené složky, které tak získají nezávislost na americké infrastruktuře. Je však nutné zohlednit, že Galileo je stále relativně nový systém – úroveň provozních zkušeností a historie spolehlivosti GPS je větší. Proto nejpragmatičtější přístup v dohledné době spočívá ve využití obou systémů paralelně. Tím se dosáhne synergického efektu: kombinace GPS a Galileo zvyšuje přesnost, počet viditelných satelitů a zajišťuje redundanci v případě selhání jednoho systému . V dlouhodobém horizontu, s dozráním Galilea a jeho širším zavedením (např. povinná PRS výbava v členských státech okolo roku 2027), může evropský Galileo převzít hlavní roli pro vojenskou navigaci Evropy. Strategicky tak Evropa získá autonomní schopnost PNT, zatímco GPS zůstane důležitou kompatibilní zálohou a prostředkem interoperability v rámci aliancí.
Shrnutí: Galileo svými parametry (přesnost <1 m, odolný šifrovaný PRS signál, globální dosah) již nyní naplňuje požadavky vojenských aplikací srovnatelně s GPS. Klíčovou výhodou nahrazení GPS Galileem je evropská kontrola a bezpečnost – nehrozí záměrné omezení služby ze strany cizího státu . Na druhé straně si to vyžádá trvalou péči o vlastní infrastrukturu a koordinaci v rámci EU. Z hlediska interoperability nejde o výběr buď a nebo: ideální je integrovat Galileo do vojenských systémů po boku GPS, čímž se zvýší robustnost a spolehlivost navigace v každé situaci.
I jednostranné vypnutí (či zarušení) amerického GPS by tedy systémy vybavené podporou Galileo a obecně evropskou navigační infrastrukturu nemělo ohrozit a to včetně systémů vojenských.
Použité zdroje: GPS a Galileo oficiální dokumentace, technické zprávy a analýzy (European GNSS Service Centre, EU Space Programme Agency, U.S. DoD), články z Inside GNSS a GPS World, a další odborné zdroje citované v textu.
February 28, 2025
Victor Riparbelli - Stane se z nás poslední generace, která bude umět číst a psát? (přepis přednášky)
Přepis přednášky podnikatele Victora Riparbelliho s názvem „Will AI Make Us the Last Generation to Read and Write?“ na konferenci TED Talk 19. října 2024.
Přednáška se zabývá tím, jak by umělá inteligence mohla změnit lidskou komunikaci a potenciálně učinit tradiční gramotnost pro budoucí generace zastaralou.
Kdo je Victor Riparbelli? Zakladatel a CEO významné firmy podnikající v AI Synthesia.ai a jeden z nejvlivnějších lidí v oblasti AI.
Konec čtení a psaní, jak je známeVICTOR RIPARBELLI: Vaši vnuci budou poslední generací, která bude číst a psát. Vím, že to zní divně, téměř nemyslitelně. Text je všude kolem nás. Používáme ho stokrát denně a prorůstá do struktury našeho každodenního života. Ale dnes budu tvrdit, že neúnavná snaha lidstva o lepší způsoby předávání myšlenek a uchovávání znalostí nekončí u textu.
Myslím, že stojíme na úsvitu nové éry komunikace s využitím umělé inteligence. A myslím si, že budoucí generace budou text pomalu nahrazovat intuitivnějšími formami komunikace, jako je zvuk, video a nakonec i imerzivní technologie. A myslím, že jednoho dne se budeme na čtení a psaní dívat jako na historické artefakty, podobně jako na papyrové svitky, hieroglyfy nebo jeskynní malby.
Nechápejte mě špatně, já čtu rád. To není osobní msta vůči textu. K mým nejmilejším vzpomínkám patří procházky po místní knihovně v Kodani, kterou tady vidíte za mnou, vybírání nejrůznějších knih, většinou sci-fi, vracení se domů, abych si je přečetl a mohl se tam zase vrátit a vybrat si další sadu vzrušujících knih ke čtení. Rád jsem se ztrácel v těchto světech, které byly jiné než fyzický svět kolem mě.
Internet všechno změnilA to se samozřejmě jen umocnilo, když jsem asi v deseti letech objevil internet, který mi otevřel zcela nový svět myšlenek, hudby a lidí. Informace na internetu však byly zdarma a já na vlastní oči viděl, jak technologie nezměnila jen distribuci obsahu, ale i obsah samotný. Rozdíl mezi živým fórem a knihou je obrovský, že? Blog a noviny a tak dále.
V hudbě, která je mou velkou mimopracovní vášní, jsem viděl, jak softwarové nástroje, samplování a bicí automaty daly vzniknout zcela novým žánrům, které předtím nebyly možné. A nejen to, všichni lidé na celém světě, kteří vytvářeli novou, vzrušující hudbu, se o ni mohli podělit se světem bez prostředníků v podobě vydavatelství.
Videohry, které jsem hrál, se připojily k internetu. Vytvářeli jste komunity s lidmi z celého světa, které jste neznali. Alespoň tak si to mysleli moji rodiče. Svůj první podnik jsem založil ve třinácti letech ve hře World of Warcraft. Bylo nás 50 lidí, kteří jsme společně zabíjeli draky online, a později jsem v životě zjistil, že to vlastně není tak odlišné od vedení startupu.
Od her k umělé inteligenciA právě tyto první roky mého života podnítily můj celoživotní zájem o média a technologie, o to, jak mění způsob, jakým tvoříme, konzumujeme, hrajeme a komunikujeme. A v roce 2016 jsem objevil výzkumnou práci s názvem Face-to-Face od profesora Matthiase Miesnera a jeho týmu. Sestrojili systém, který pomocí neuronových sítí dokázal vytvořit opravdu, ale opravdu fotorealistické video.
A když jsem to viděl poprvé, měl jsem pocit, že jsem viděl kouzlo. A byl jsem přesvědčen, že za deset let budete moci vytvořit hollywoodský film ze své ložnice, aniž byste potřebovali cokoli jiného než jen svou představivost. To bude za tři roky a myslím, že to skutečně vydrží.
Nemohl jsem tuhle myšlenku dostat z hlavy a nakonec jsem spolu s Matthiasem a Ludusem a Steffenem, mými spoluzakladateli, založil společnost Synthesia, která se zabývá umělou inteligencí ve videu. A to byl opravdu způsob, jak skloubit můj zájem o média, technologie a sci-fi. Společnost jsme založili s vizí, že z každého člověka na světě uděláme hollywoodského režiséra.
A i když je to rozhodně stále velmi vzrušující vize, postupem času jsme si uvědomili, že jakkoli jsou hollywoodské filmy generované umělou inteligencí vzrušující, je to jen špička ledovce. Skutečně vzrušující potenciál těchto technologií spočívá v tom, že umožní oživit ve videu a zvuku každý jednotlivý obsah, od textových zpráv přes romány až po nudné firemní školicí materiály.
Vývoj lidské komunikaceNež si však povíme více o videu, pojďme si povědět něco o textu. Text je původním způsobem komprese lidské komunikace. Své myšlenky a znalosti kódujeme do symbolů, které mohou přenášet význam napříč časem a prostorem. Nebylo tomu tak vždy. Před tisíci lety text neexistoval a jediným způsobem, jak sdílet informace, byla ústní komunikace.
V roce 1500 př. n. l. byla vynalezena první abeceda, která v podstatě převzala tyto velmi složité systémy psaní a zjednodušila je na pouhých několik znaků, čímž položila základy moderní společnosti, kterou známe dnes. V roce 1440 vynalezl Gutenberg knihtisk a poprvé v historii jsme mohli masově produkovat psaný obsah. Trvalo až do poloviny 20. století, než se čtení stalo masovou záležitostí a lidé se pomalu stávali gramotnými.
Omezení textuPokud se přesuneme do dnešní doby, text je všudypřítomný a žít život bez schopnosti číst a psát je nemožné. Ale jakkoli je text skvělý, je to nedokonalá technologie. Je velmi efektivní a škálovatelná. Ale je to velmi, velmi ztrátová metoda komprese informací. Postrádá všechny nuance a dodatečné informace, které získáme, když s někým mluvíme v reálném životě. Váš tón hlasu, řeč těla, místo, kde se nacházíte, všechny tyto věci jsou pro toto sdělení důležité, že?
Text lze interpretovat milionem různých způsobů v závislosti na příjemci. Je to dobrá, nebo špatná zpráva? To je velmi těžké říct, že? Ale vynalezli jsme emotikony, abychom to trochu vylepšili. Ale ani emodži nejsou dokonalé. Lidé stále diskutují o tom, zda je tento smajlík šťastný. Je snad naštvaný? Chystá se vás zabít? Debata pokračuje.
Síla vizuální komunikaceA když se zamyslíte nad vizuální komunikací, tohle je obrázek. Všem vám trvalo pár vteřin, než jste se na tento obrázek podívali a pochopili ho, že? Je to velmi intuitivní způsob konzumace informací. Co kdybych se s vámi místo toho podělil o tento textový popis obrázku? Trvalo by vám 30 sekund, než byste si ho přečetli? Vysoké kognitivní zatížení, abyste tyto kousky symbolů vzali a v mysli z nich vytvořili obraz, že? A i kdybych vám dal 30 stránek popisu, vždycky byste si představili jiný obraz, než jaký právě teď vidíte za mnou.
Jakmile přidáme časový rozměr, jako je tomu u videa, tento problém se masivně prohloubí. Není tedy až tak zvláštní, že od vynálezu textu inovujeme směrem k bohatším a intuitivnějším způsobům výměny informací. Vynalezli jsme rádio, televizi, internet, VR, sociální média a nyní umělou inteligenci.
Vzestup videa a zvukuV roce 2024 je zcela zřejmé, že se lidé chtějí dívat a poslouchat. Pokud se podíváte na digitální ekonomiku, nejrychleji rostoucí sociální sítí je TikTok. Je také nejrychleji rostoucím vyhledávačem, což je velmi zajímavé. Video a zvuk jsou všude v aplikacích, které používáme. V aplikaci WhatsApp posíláme hlasové poznámky. Nyní jsme v seznamovacích aplikacích. Když nakupujeme, sledujeme produktová videa.
A moje teze je, že čím více konzumujeme video, tím více nás nudí text. A musím říct, že to platí i pro mě, přestože rád čtu. Když se učím něco nového, obvykle začnu na YouTube, na TikToku nebo poslouchám podcast. A jen když mě něco opravdu, ale opravdu zajímá, tak si udělám hodiny času na to, abych si přečetla dvousetstránkovou knihu. Už mi to prostě tolik nestojí za to.
A mnozí z vás to nejspíš cítí stejně. Chcete se učit hudební teorii z dlouhé knihy, nebo z videa na YouTube, které má zvuk? Chcete cestou do práce poslouchat zprávy v podcastu nebo si někde složit ten fyzický list papíru? Většina lidí to tak cítí.
Vina moderní konzumace médiíVšichni však máme tento pocit viny. Alespoň já ji mám. Cítím se provinile, když se dívám na videa a když poslouchám podcasty, místo abych vzal do ruky starou dobrou knihu. Když k tomu slyšíte komentáře, mladí lidé se už nedokážou soustředit. Potřebují neustálé dávky dopaminu z laciného obsahu, který projíždějí v aplikacích na sociálních sítích. Už nevycházejí ze svého pokoje. Přesně to samé říkají rodiče už 200 let.
Mám jeden výsadní nápad. Co když jsme všichni jen unavení z příliš hutných a pomalých informací? Knihy s příliš mnoha stránkami. Novinové články s výplní. Co když začneme být mnohem citlivější na kvalitu a stručnost obsahu, který konzumujeme, protože nyní máme nekonečný výběr? Co když se současná generace dětí dokáže učit a vstřebávat informace mnohem rychleji díky technologiím, ne jim navzdory? Je problém v nás, nebo v textu?
Stále ještě hodně čteme, že? Jen čteme každý den z mnoha různých zdrojů, nejen z knihy a novin. Čteme v aplikacích pro zasílání zpráv a na sociálních sítích.
A náš blog. Posloucháme dlouhé podcasty. Velmi se to rozrůstá, že? Ale stále máme představu, že knihy jsou v jistém smyslu morálně nadřazené. A i když vám přednáším, stále to velmi silně pociťuji. Nevím, proč tomu tak je. Nechám to na někom jiném, aby to prozkoumal. Ale rozhodně je velmi zajímavé, jak psychologicky přisuzujeme větší hodnotu psanému slovu.
Ekonomika tvorby obsahuProč je tedy tolik informací stále textových, když ve skutečnosti dáváme přednost videu? Je to docela jednoduché. Odpovědí jsou náklady. Náklady v čase a náklady v penězích. Dnes si musíme vybrat mezi rychlostí a rozsahem textu nebo přesností a angažovaností videoobsahu.
A tak je zde základní ekonomická motivace, kdy se do video a audio formátů převádí pouze obsah a myšlenky a znalosti, které považujeme za dostatečně důležité. A tak to v zábavním průmyslu znamená, že dostáváme spíše Rychle a zběsile 278 než avantgardní filmy od studentů filmových škol. Ve firemním světě to znamená, že reklama na Super Bowl je video, ale video o požární bezpečnosti je dlouhý, nudný dokument.
Jak umělá inteligence změní tvorbu obsahuA to se brzy změní ve velkém, velkém stylu. Umělá inteligence tuto rovnici zcela změní. Díky AI můžeme získat jak rychlost, tak rozsah, přesnost a angažovanost. AI dokáže digitálně vytvářet vysoce fotorealistický obsah. Počítače se mohou naučit, jak vypadá svět, a mohou ho replikovat a remixovat do úžasných detailů.
Tím se spustí nová vlna kreativity. A nebude řízena Hollywoodem. Budou ji pohánět youtubeři a mladí lidé se skvělými nápady, kteří tyto nástroje využijí a budou vyprávět úžasné příběhy.
Avataři s umělou inteligencí a digitální lidéVe společnosti Cynthesia se zaměřujeme na avatary AI, digitální lidi, kteří zní a vypadají jako my. Mohou být dokonce námi, pokud si vytvoříte svůj klon. Dnes už naši avataři komunikují s miliony lidí každý den. Učí školní předměty, nastupují do restaurací, poskytují zdravotní poradenství a prodávají produkty ve více než 130 různých jazycích. A začínají být opravdu dobří. Velmi brzy je bude velmi obtížné odlišit od reality.
„Dobrý den. Jsem Alex, osobní avatar. Jsem tak nadšený a šťastný, že jsem tady. Vidíte, jak výrazný jsem a slyšíte, jak přirozeně zním? Není to skvělé? Zatím se měj. Doufám, že se brzy uvidíme.“
Toto video je kompletně vytvořeno umělou inteligencí. Já jsem Alex. Stále neví, kdy přestat mluvit.
S těmito technologiemi tedy můžeme vytvořit cokoli, aniž bychom potřebovali kamery. Můžeme přivést k životu své představy bez tradičních bariér v podobě dovedností a nákladů.
Demokratizace tvorby videaCo je však na všech těchto nových technologiích ještě zajímavější, je to, že díky nim bude vytváření obsahu nesmírně snadné pro kohokoli. Už jsme viděli, jak klávesnice a počítače z nás všech udělaly spisovatele. Viděli jsme, jak PowerPoint z nás všech udělal designéry. A s umělou inteligencí se každý bude moci stát režisérem a vytvářet videa hollywoodské kvality, aniž by k tomu potřeboval jakékoli školení, jako to vidíte tady za mnou.
V Zendidě jsme už z více než milionu lidí udělali tvůrce videí a je opravdu zábavné sledovat, o čem všem lidé natáčejí videa, ale nemusí se ptát svého šéfa, protože se prostě mohou přihlásit a natáčet videa sami.
Výzkum preferencí při učeníProč lidé natáčejí videa? Zatím to není příliš prozkoumaná oblast, ale spolupracujeme s UCL v Londýně, abychom zjistili, jak se učíme jinak s videem a videem s umělou inteligencí než s textem. Provedli jsme studii se 400 účastníky. Stále probíhá. Výsledky plánujeme zveřejnit někdy v příštím roce, ale máme opravdu zajímavé první poznatky.
Když se lidí prostě zeptáte, zda se raději učíte pomocí videa s umělou inteligencí, nebo pomocí textu, výsledky jsou docela překvapivé. Až 77 % lidí se raději učí prostřednictvím videa.
Mimo tradiční mediální formátyRychlejší a jednodušší tvorba obsahu tak bude mít transformační význam. Ale s novými technologiemi vždy vymýšlíme nové mediální formáty. A právě teď je většina obsahu vytvářeného umělou inteligencí tím, čemu říkám překlenovací žánr. Používáme ho k vytváření starých formátů pomocí nových technologií.Stejně jako první webové stránky vypadaly jako noviny na obrazovce, jsou dnes videa s umělou inteligencí lineární. Mají začátek a konec. V podstatě napodobují to, co můžeme zaznamenat fyzickou kamerou.
Jakmile zkombinujeme AI videa s uvažovacími systémy, jako jsou jazykové modely, odemkneme zcela nový typ médií, která budou interaktivní a personalizovaná. Budou schopna přemýšlet, vyprávět a personalizovat obsah za nás.
Budoucnost personalizovaného učení a zábavyPokud se učíte hudební teorii, budete mít k dispozici asistenta, který zná úroveň vašich dovedností, zná váš hudební vkus a podle toho sestaví učební plán. Všechny vaše děti možná budeme mít ve škole jejich oblíbené celebrity, které je budou učit matematiku. A budou to dělat v kontextu, který je pro vaše dítě zajímavý. Třeba to bude fotbal nebo sci-fi nebo cokoli jiného. Vzdělávání bude díky těmto novým systémům umělé inteligence nabitější.Zábava se změní. Bude se utvářet podle diváků a okolního světa.
Pravděpodobně budeme mít interaktivní filmy. Budeme mít televizní seriály, které nikdy neskončí. Zní to divně, ale v mnoha ohledech je právě tohle kanál sociálních médií, že? Je to prostě konec příběhu. Váš kanál TikTok je také nekonečný proud personalizovaného obsahu určeného právě pro vás.
A když to zkombinujeme s novými formami, jako je rozšířená realita, virtuální realita, rozhraní mozek-počítač, budou se média stále více podobat skutečnému životu. Možná budeme v budoucnu předávat zprávy svým přátelům jen prostřednictvím myšlenek. A naše schránka nebude textová. Budou to videa všech vašich přátel a avatarů vašich příbuzných s umělou inteligencí, kteří s vámi budou mluvit. Zní to divně, ale myslím, že to není tak daleko. A slibuji vám, že vaše video o požární bezpečnosti v práci bude v nedaleké budoucnosti spielbergovským mistrovským dílem.
Etické a filozofické otázkyTyto technologie otevírají Pandořinu skříňku otázek. Jsou tu otázky etické, politické, designové i komerční. A v těchto otázkách se dnes mnoho řečníků podělilo o skvělé názory.
Nechám vás tu s několika provokativními otázkami. Záleží vám na tom, zda je náš obsah generován umělou inteligencí, nebo ne? Záleží vám na tom, když se ve filmu používají speciální efekty nebo zelené plátno? Není nám jedno, že herci v reklamách jsou placeni za to, aby hráli někoho jiného a propagovali produkty, o kterých pravděpodobně nikdy neslyšeli?
Záleží nám na tom, zda jsou herci skuteční, nebo generovaní? Jste fanoušky Harryho Pottera nebo Daniela Radcliffa? Záleží na tom, že Daniel Radcliffe existuje ve skutečném světě? Pravděpodobně se s ním nikdy nesetkáte, že? A co Mickey Mouse nebo postavičky z Pixaru? Můžeme k nim něco cítit, přestože jsou vytvořeny umělou inteligencí?
Budeme důvěřovat agentům s umělou inteligencí, nebo budete stále chtít zavolat do call centra a mluvit s člověkem? Mohou nás bavit počítače, které spolu komunikují? Chtěli byste hrát s počítači, hrát fotbal nebo šachy proti sobě? Možná ne.
ZávěrBudoucnost je před námi, a i když mnohé z toho zní jako sci-fi, ve skutečnosti není tak daleko. A je na nás všech v této místnosti a ve společnosti, abychom se postarali o to, že vybudujeme opravdu úžasnou budoucnost. Myslím, že na to máme technologie a myslím, že na to máme lidi.
Děkuji vám.
Poznámka na závěr: nesouhlasím s Riparbellim, že by uživatelé plošně dávali přednost videoobsahu. Videoobsah je velmi řídké médium, poměr informací k nutné délce konzumace je nevýhodný oproti psanému textu. Pro náročnější informace je psaný text stále výhodnější, než video, video se hodí pro povrchnější informovanost. Což ale neznamená, že nesouhlasím v hlavní myšlence, že video se začne stávat stále významnějším způsobem informovanosti…
Ed Newton-Rex - Jak modely umělé inteligence kradou tvůrčí práci - a co s tím
Toto je přepis a překlad přednášky Eda Newton-Rexe s názvem Jak modely umělé inteligence kradou tvůrčí práci - a co s tím? z konference TEDx v říjnu 2024.
Kdo je Ed Newton-Rex? Bývalý viceprezident Stability AI (rezignoval právě na protest proti vykrádání tvůrčích děl prostřednictvím AI), skladatel hudby. Zde má web.
Technologie a vize generativní umělé inteligence je úžasná, ale krádež práce světových tvůrců při jejím vytváření nikoli. Existují tři klíčové věci, které společnosti zabývající se umělou inteligencí potřebují k vytvoření svých modelů, tři klíčové zdroje: lidé, výpočetní technika a data. Tedy inženýry, kteří modely vytvářejí, grafické procesory, na nichž probíhá proces trénování, a data, na nichž se modely trénují. Společnosti zabývající se umělou inteligencí vynakládají obrovské částky na první dva zdroje, někdy milion dolarů na inženýra a až miliardu dolarů na model, ale očekávají, že třetí zdroj, tréninková data, získají zdarma.
V současné době mnoho společností zabývajících se umělou inteligencí trénuje na tvůrčí práci, za kterou nezaplatily, a dokonce ani nepožádaly o povolení k jejímu použití. To je nespravedlivé a neudržitelné. Pokud však tréninková data přenastavíme a budeme jim poskytovat licence, můžeme vybudovat lepší generativní ekosystém AI, který bude fungovat pro všechny - jak pro samotné společnosti zabývající se AI, tak pro tvůrce, bez jejichž práce by tyto modely neexistovaly.
Většina společností zabývajících se umělou inteligencí dnes většinu svých tréninkových dat nelicencuje. Používají webové scrapery, aby našly, stáhly a trénovaly na co největším množství obsahu, který se jim podaří shromáždit. Často jsou dost tajnůstkářské ohledně toho, na čem trénují, ale je jasné, že trénování na autorsky chráněných dílech bez licence je rozšířené. Když například nadace Milla Foundation zkoumala 47 velkých jazykových modelů vydaných v letech 2019 až 2023, zjistila, že 64 % z nich bylo částečně vyškoleno na Common Crawl, datové sadě, která obsahuje díla chráněná autorským právem, jako jsou novinové články z významných publikací, a dalších 21 % neprozradilo dostatek informací, aby se to dalo poznat tak jako tak. Trénování na dílech chráněných autorským právem bez licence se rychle stalo standardem ve velké části odvětví generativní umělé inteligence.
Ale toto učení - toto učení bez licence na tvůrčí dílo - má vážné negativní důsledky pro lidi, kteří za tímto dílem stojí. A to z prostého důvodu, že generativní umělá inteligence konkuruje svým tréninkovým datům. To není příběh, který společnosti zabývající se umělou inteligencí rády líčí. Rádi mluvíme o demokratizaci, o tom, že umožníme více lidem být kreativní, ale skutečnost, že AI konkuruje svým tréninkovým datům, je nevyhnutelná.
Velký jazykový model vycvičený na krátkých příbězích může vytvořit konkurenční krátké příběhy. Obrazový model vycvičený na stockových obrázcích může vytvořit konkurenční stockové obrázky. Hudební model umělé inteligence vycvičený na hudbě, která je licencována pro televizní pořady, může vytvořit konkurenční hudbu, která bude licencována pro televizní pořady. Tyto modely, jakkoli nedokonalé, jsou tak rychlé a snadno použitelné, že je tato konkurence nevyhnutelná.
A není to jen teoretické. Generativní umělá inteligence je stále ještě poměrně nová, ale již nyní jsme svědky přesně takových efektů, jaké lze očekávat ve světě, v němž generativní umělá inteligence konkuruje svým tréninkovým datům. Například známý filmař Ram Galvama nedávno prohlásil, že bude ve všech svých projektech v budoucnu používat hudbu z umělé inteligence. Skutečně se objevilo několik zpráv o tom, že lidé začínají poslouchat hudbu AI namísto hudby produkované lidmi, a nedávno se píseň AI dostala na 48. místo německé hitparády. Ve všech těchto případech hudba AI konkuruje skladbám, na kterých byla vyškolena.
Nebo si vezměte Kelly McKernan. Kelly je umělkyně z Nashvillu. Deset let si vydělávala dost peněz prodejem svých děl; umění bylo jejím příjmem na plný úvazek. Ale v roce 2022 byl soubor dat, který obsahoval jejich díla, použit k trénování populárního obrazového modelu AI. Jejich jméno bylo jedním z mnoha, které používalo obrovské množství lidí k vytváření umění ve stylu konkrétních lidských umělců. Kelly příjem se téměř přes noc snížil o 33 %. Ilustrátoři po celém světě hlásí podobné příběhy - jsou převálcováni modely umělé inteligence, o kterých mají důvod se domnívat, že byly vycvičeny na jejich práci.
Platforma pro volnou tvorbu Upwork napsala bílou knihu, v níž se zabývala dopady, které na trhu práce zaznamenala generativní umělá inteligence. Podívali se na to, jak se od zavedení ChatGPT změnily nabídky práce na jejich platformě, a zjistili přesně to, co se dalo očekávat: generativní AI snížila poptávku po úkolech psaní na volné noze o 8 %, což se zvýší na 18 %, pokud se podíváte pouze na to, co označují jako úkoly „nižší hodnoty“. Takže výchozí data, která máme k dispozici, plus jednotlivé příběhy, které slyšíme, se shodují s logickým předpokladem: generativní AI konkuruje práci, na které je vyškolena. Je tak rychlá a snadno použitelná, že je to nevyhnutelné. A konkuruje lidem, kteří za touto prací stojí.
Tvůrci nyní tvrdí, že toto učení je nezákonné. Právní rámec autorských práv poskytuje tvůrcům výhradní právo na autorizaci kopií jejich díla a trénink umělé inteligence zahrnuje kopírování. Zde v USA mnoho společností zabývajících se umělou inteligencí argumentuje tím, že učení umělé inteligence spadá pod výjimku z autorského práva pro spravedlivé užití, která umožňuje nelicencované kopírování za omezeného souboru okolností, jako je například vytváření parodií na dílo. Tvůrci a držitelé práv s tím důrazně nesouhlasí a tvrdí, že tuto úzkou výjimku nelze v žádném případě použít k legitimizaci masového využívání tvůrčího díla za účelem vytvoření automatizované konkurence tohoto díla. A aby bylo jasno, zcela s nimi souhlasím.
Tato otázka samozřejmě dosud nebyla soudně prověřena a v současné době probíhá asi 30 soudních sporů podaných držiteli práv proti společnostem zabývajícím se umělou inteligencí, které pomohou tuto otázku vyřešit. Bude to však trvat dlouho a tvůrci nyní trpí tím, co považují za nespravedlivou konkurenci.
Proto navrhují řešení, které se používalo a fungovalo již dříve: udělování licencí. Pokud chce komerční subjekt použít dílo chráněné autorským právem, ať už pro výrobu zboží, výrobu nebo budování streamovací služby, poskytne si licenci na toto dílo.
Společnosti zabývající se umělou inteligencí mají nyní spoustu důvodů, proč by se to na ně nemělo vztahovat. Existuje právní výjimka pro spravedlivé užití, kterou jsem již zmínil. Existuje také argument, že když lidé mohou trénovat na díle chráněném autorským právem bez licence, měla by to mít umělá inteligence dovoleno také. Toto tvrzení je však velmi těžko zdůvodnitelné. Umělci se od sebe navzájem učí už po staletí. Když tvoříte, očekáváte, že se od vás ostatní budou učit. Učíte se z řady zdrojů, od jiných umění přes učebnice až po lekce, z nichž většinu jste zaplatili vy nebo někdo jiný, čímž podporujete celý ekosystém.
V generativní umělé inteligenci komerční subjekty v hodnotě milionů nebo miliard dolarů seškrabávají co nejvíce obsahu, často proti vůli tvůrců, bez placení, přičemž cestou vytvářejí několik kopií (které podléhají autorskému právu), aby vytvořily vysoce škálovatelnou konkurenci tomu, co kopírují - tak škálovatelnou, že existují generátory obrázků s umělou inteligencí, které podle odhadů vytvářejí 2,5 milionu obrázků denně, a generátory písní s umělou inteligencí, které produkují 10 písní za sekundu. Tvrdit, že lidské učení a trénink AI jsou stejné a mělo by se s nimi zacházet stejně, je absurdní.
Společnosti zabývající se umělou inteligencí také tvrdí, že licencování jejich tréninkových dat by bylo nepraktické. Tvrdí, že používají tolik tréninkových dat, že jednotlivé platby každému tvůrci, který za daty stojí, by byly malé. To však platí pro mnoho trhů s licencemi na obsah; tvůrci chtějí dostat zaplaceno, i když jsou platby malé.
Společnosti zabývající se umělou inteligencí také tvrdí, že jednoduše používají příliš mnoho dat na to, aby bylo licencování vůbec proveditelné. Tomu je však stále těžší věřit ve světě, v němž existuje taková škála datových souborů, k nimž lze získat přístup s povolením. Můžete si licencovat data od mediálních společností - jen za poslední rok bylo uzavřeno 27 velkých dohod mezi společnostmi zabývajícími se umělou inteligencí a držiteli práv, a to nemluvím o těch menších, o kterých se neinformuje. Existují tržiště tréninkových dat, kde můžete získat další data. Můžete je rozšířit o data, která jsou veřejnou doménou - to znamená, že na ně neexistují žádná autorská práva - jako například soubor dat Common Corpus s 500 miliardami slov. Můžete to dále rozšířit o syntetická data, tj. data, která vytvořil sám model umělé inteligence a na která obvykle neexistují žádná autorská práva.
Pokud tedy chcete vytvořit svůj model, aniž byste porušili autorská práva, máte k dispozici více možností. Nejpádnějším důkazem toho, že je možné licencovat všechna data, je však skutečnost, že to již dělá více společností. Vím to, protože jsem to sám udělal. Více než deset let pracuji v oblasti, které dnes říkáme generativní umělá inteligence, a loni v září můj tým ve společnosti Stability AI vydal hudební model umělé inteligence, který se trénoval na licencované hudbě. Totéž udělala řada dalších společností.
A já jsem založil Fairly Trained, abych na tuto skutečnost upozornil. A tyto společnosti? Fairly Trained je nezisková organizace, která certifikuje společnosti zabývající se generativní umělou inteligencí, které netrénují na autorsky chráněných dílech bez licence. Spustili jsme ji letos v lednu a certifikovali jsme už 18 společností.
Tyto společnosti přistupují k licencování svých tréninkových dat různě. Máme hlasový model AI, který je trénován na jednotlivých hlasech, na které má licenci. Máme hudební model AI, který si licencoval více než 40 hudebních katalogů. Máme velký jazykový model, který je vycvičen pouze na datech ve veřejné doméně, většinou z vládních dokumentů a záznamů. Máme společnosti, které za svá data zaplatily předem. Máme společnosti, které se dělí o své příjmy s poskytovateli dat. Neexistuje jediná odpověď na přesná specifika toho, jak má některá z těchto licenčních dohod fungovat. Krása licencování spočívá v tom, že se obě strany mohou sejít a vymyslet, co jim bude vyhovovat. A to se děje stále častěji.
Nyní uslyšíte, že požadavek na licencování tréninkových dat nějak dusí inovace, že jsou to jen velké společnosti zabývající se umělou inteligencí, které si mohou dovolit tyto obrovské počáteční licenční poplatky. Ve skutečnosti jsou to ale menší startupy, které se obtěžují licencovat všechna svá data, a často tak činí bez vysokých počátečních licenčních poplatků, ale s využitím modelů, jako jsou podíly na příjmech.
A licencování tréninkových dat má ještě jednu významnou výhodu. Všechna tato učení na základě autorských práv nutí vydavatele uzavírat přístup ke svému obsahu. Iniciativa Data Provenance Initiative se zabývala 14 000 webovými stránkami běžně používanými v tréninkových sadách AI a zjistila, že v průběhu jediného roku při pohledu pouze na domény s nejvyšší hodnotou pro trénink AI vzrostl počet těch, které byly omezeny prostřednictvím robots.txt nebo podmínek služby, ze 3 % na 20 až 33 %. Web se postupně uzavírá kvůli nelicencovanému učení. To je nyní špatné pro nové modely umělé inteligence, pro nové účastníky trhu, ale také pro všechny - výzkumníky, spotřebitele a další -, kteří z otevřeného internetu těží.
Nemělo by nás překvapit, že se široká veřejnost neshodne se společnostmi zabývajícími se umělou inteligencí na tom, na čem mohou trénovat své modely. V jednom z dubnových průzkumů Institutu pro politiku umělé inteligence (AI Policy Institute) byli lidé dotazováni na společnou politiku společností zabývajících se umělou inteligencí, která spočívá v trénování na veřejně dostupných datech. Jedná se o data, která jsou otevřeně dostupná online, což samozřejmě zahrnuje spoustu děl chráněných autorskými právy, jako jsou zpravodajské články a často pirátská média. Šedesát procent lidí uvedlo, že by to nemělo být povoleno, oproti pouhým 19 %, kteří uvedli, že by to povoleno být mělo.
Stejný průzkum se dále ptal, zda by společnosti zabývající se umělou inteligencí měly poskytovatelům dat vyplácet kompenzace: 74 % respondentů odpovědělo, že ano, a pouze 9 % odpovědělo, že ne. Znovu a znovu, když se veřejnosti ptáme na tyto otázky, ukazuje se, že podporuje požadavky týkající se povolení a plateb a odmítá představu, že když je něco veřejně dostupné, dělá to z toho nějakým způsobem férovou hru.
A lidé, kteří vytvářejí umění, jež společnost konzumuje, to cítí stejně. Dnes jsme vydali prohlášení o tréninku umělé inteligence, krátký, jednoduchý otevřený dopis, který jednoduše zní: „Nelicencované používání tvůrčích děl pro trénink generativní umělé inteligence je velkou a nespravedlivou hrozbou pro živobytí lidí, kteří za těmito díly stojí, a nesmí být povoleno.“ Tento dopis již podepsalo 11 000 a více tvůrců z celého světa, včetně autorů oceněných Nobelovou cenou, herců oceněných Oscarem a skladatelů oceněných Oscarem. A pokud s tímto názorem souhlasíte, vyzývám vás, abyste jej podepsali ještě dnes na stránkách AITrainingStatement.org.
Z tohoto a jemu podobných předchozích prohlášení je naprosto zřejmé, že tito umělci, tito tvůrci, považují nelicencované učení svých děl generativními modely umělé inteligence za naprosto nespravedlivé a potenciálně katastrofální pro jejich profese. Pokud jste tedy zastánci nelicencovaného tréninku umělé inteligence, nezapomeňte, že lidé, kteří napsali hudbu, kterou posloucháte, a knihy, které čtete, s tím pravděpodobně nesouhlasí.
Kam nás to tedy zavede? No, právě teď mnoho světových umělců, spisovatelů, hudebníků a tvůrců generativní AI přímo nenávidí. A z jejich vlastních slov víme, že jedním z důvodů je to, že trénujeme na jejich práci, aniž bychom se jich zeptali.
Ale nemusí to tak být. Odvětví umělé inteligence a kreativní průmysl mohou být - a měly by být - vzájemně prospěšné. Aby však tento vzájemně prospěšný vztah mohl vzniknout, musíme vycházet z pozice respektu k hodnotě děl, na kterých se školí, a k právům lidí, kteří je vytvořili.
Netvrdím, že by se měl zastavit veškerý vývoj umělé inteligence. Netvrdím, že by umělá inteligence neměla existovat. Tvrdím jen, že prostředky použité k vytvoření generativní UI by měly být zaplaceny. Licencování je tvrdá práce. Krátkodobě vás to zpomalí, ale nakonec dosáhnete úplně stejného cíle - modelů, které budou stejně schopné, stejně výkonné - a dosáhnete toho, aniž byste nutili světové vydavatele, aby se chytali za nos a ničili komunity, a aniž byste proti sobě poštvali světové tvůrce.
Doufám tedy, že více společností zabývajících se umělou inteligencí bude následovat příkladu těch, které jsme certifikovali ve společnosti Fairly Trained, a budou licencovat všechna svá tréninková data. Doufám, že zaměstnanci těchto společností to budou vyžadovat od svých zaměstnavatelů. A doufám, že každý, kdo používá generativní umělou inteligenci, se bude ptát, na čem byly trénovány jeho oblíbené modely.
Existuje budoucnost, ve které mohou generativní umělá inteligence a lidská kreativita koexistovat - nejen v míru, ale i v symbióze. Začátek byl těžký, ale ještě není pozdě změnit směr.
Děkuji za pozornost.
February 22, 2025
John Tasioulas - Proč je umělá inteligence hrozbou a jak ji využít pro dobro věci (přepis přednášky)
Přepis přednášky Johna Tasioulase s názvem „Why AI Is A Threat - And How To Use It For Good“ na konferenci TEDxAthens 2025, která se konala 16. února 2025.
JOHN TASIOULAS: Jsem filozof v Aténách v roce 2024 a mluvím s vámi o umělé inteligenci. To je velké vzrušení a velká čest. Možná se ale ptáte, co má starověká filozofická disciplína co říci k revoluci v umělé inteligenci?
Mám 15 minut na to, abych vám to vysvětlil. Vraťme se k Sokratovi v Republice. Ten říká, že otázka, kterou se zabýváme, není triviální. Je to otázka, jak má člověk žít? A tato otázka, jak bychom měli žít, je ústřední filosofickou otázkou.
Je to však také otázka, na kterou si každý z nás musí odpovědět sám. Proto Sokrates vedl své dialogy na aténské agoře s obyčejnými občany. A díky umělé inteligenci je o to naléhavější si tuto otázku znovu položit, protože tato technologie je natolik převratná, že by mohla změnit naše životy k lepšímu i k dobrému. Proto si tuto otázku musíme znovu položit ve světle těchto nových technologických vymožeností, které Sokrates nemohl předvídat.
Umělá inteligence však nejenže činí tuto otázku, jak bychom měli žít, naléhavější, ale vytváří pro nás při řešení této otázky problémy, nové problémy, nové hrozby pro naši schopnost odpovědět na Sokratovu otázku. Dnes tedy budu hovořit o třech z těchto hrozeb.
Hrozba 1: Zkreslení sebepochopeníPrvní hrozba spočívá v tom, že umělá inteligence hrozí narušením našeho sebeporozumění, našeho chápání toho, co je to být člověkem. Všechny velké technologické korporace tvrdí, že mají stejný cíl. Jejich cílem je vytvořit umělou obecnou inteligenci. Umělá obecná inteligence je inteligence, která kopíruje celé spektrum lidské inteligence. Tedy schopná napsat báseň, stanovit diagnózu rakoviny, rozhodnout o přijetí do zaměstnání, udělat vše, co dokáže člověk.
Pokud však budeme usilovat o AGI jako o cíl, bude zde pokušení, pobídka, představovat si, že AGI bylo dosaženo, protože jsme změnili cíl, změnili jsme vlastní chápání toho, co jsou lidé, a smazali jsme rozdíl mezi lidmi a stroji. Toto rozlišení však musíme zachovat.
Jaké jsou tedy rozdíly? No, jeden zásadní rozdíl se týká porozumění. Systém umělé inteligence, jako je GPT-3, velký jazykový model, pracuje na základě statistických korelací mezi daty. Tyto statistické korelace mu nedávají skutečné porozumění, jaké by měl člověk o tom, co je to kočka nebo co je to elektron. Lidé takové pochopení mají, částečně proto, že jsme ztělesnění agenti, kteří se zabývají fyzickou realitou. A jeden ze způsobů, jak se tento rozdíl projevuje, je, že existuje vlastnost, kterou má většina lidí, a tou je zdravý rozum, který se pro systémy umělé inteligence ukázal jako velmi nepolapitelný. Jinými slovy, systémy umělé inteligence dělají spektakulární chyby, kterých by se žádný člověk nikdy nedopustil.
Zamění si kočku se skateboardem nebo člověka s gorilou. Žádný člověk by tyto chyby nikdy neudělal, protože lidé mají zakořeněné chápání světa způsobem, který stroj pracující na základě korelací mezi datovými body nemá. Porozumění je tedy velký rozdíl.
Ale je tu ještě jeden velký rozdíl, a to ten, že lidé mají schopnost racionální autonomie. Máme schopnost zvolit si své cíle, rozhodnout se, zda chceme být lékařem, nebo herečkou.
Chceme být právníkem nebo hudebníkem? A zvolit si tyto cíle s ohledem na všechny důvody pro a proti pro každou možnost. To systém umělé inteligence nedokáže. Má v sobě naprogramovaný cíl a optimalizuje se pro jeho splnění. Možná si teď řeknete, že když začneme stírat rozdíl mezi člověkem a strojem, jaký je v tom rozdíl?
Proč je to důležité? Proč to představuje hrozbu? Myslím, že důvodem, proč je to hrozba, je důvod, který uvedl Aristoteles, totiž že chceme-li vědět, co je dobrý život pro člověka, musíme vědět, jaké jsou charakteristické schopnosti člověka. Tyto schopnosti uvažovat, komunikovat, společensky se angažovat, které se projevují v nejrůznějších hodnotných činnostech, jako je vědecký výzkum nebo udržování přátelství či boj za spravedlnost. Pokud ztratíme živý smysl pro schopnosti, které jako lidé máme, hrozí, že budeme mít ochuzenou etiku. Budeme ochuzeni o smysl pro hodnoty, na kterých záleží.
Jak bude tato ochuzená etika vypadat? No, jednou z jejích podob bude druh konzumerismu, který říká, že to, na čem záleží, je vaše uspokojení jako spotřebitele, které může být jen pasivní záležitostí přijímání potěšení, nikoliv uplatnění vašich schopností. Nebo existuje jiný druh etiky, který se stal velmi populárním v Silicon Valley a který říká, že cestou k lepšímu životu je transhumanismus, že je třeba překročit naši lidskou přirozenost, žít ve virtuální realitě, stát se kyborgem. Z aristotelského hlediska, podle něhož je naplněný život uplatněním svých lidských schopností, není transhumanismus, který je v těchto mocných kruzích brán vážně, cestou k utopii, ale k druhové sebevraždě.
Hrozba 2: Zkreslení chápání problémuDalší hrozba, do vývoje umělé inteligence investuje soukromý sektor astronomické částky. Předpokládá se, že v roce 2025 bude do vývoje technologií umělé inteligence investováno 200 miliard dolarů. A pro tyto společnosti bude existovat hluboká ekonomická motivace, aby nám tvrdily, že tyto systémy umělé inteligence dokáží řešit problémy lépe než lidé. A to povede k dalšímu zkreslení. Vytvoří to deformaci, v jejímž důsledku začneme stále více, možná nevědomky, měnit povahu našich problémů, způsob, jakým je chápeme, aby byly vhodnější pro řešení systémy umělé inteligence. Dovolte mi tedy uvést příklad.
Nástroje pro hodnocení rizik založené na technologii AI se již používají v trestním soudnictví. Takže jednou z otázek v trestním soudnictví je otázka kauce.
Měl by být někdo, kdo byl obviněn z trestného činu, propuštěn na svobodu a čekat na soud, nebo by měl být držen ve vazbě? Nyní existuje mnoho velmi významných myslitelů, kteří tvrdí, že systémy umělé inteligence jsou v tomto druhu rozhodování lepší než lidští soudci.
Říkají, že tento argument se skládá ze dvou částí. Jedna část spočívá v tom, že rozhodnutí o kauci je v podstatě předpovědí. Spáchá tato osoba trestný čin, pokud bude propuštěna?
A druhé tvrzení je, že systémy umělé inteligence jsou zbaveny určitých předsudků, které mají lidé, a jsou v těchto předpovědích lepší. Tento druhý krok v argumentaci je velmi kontroverzní.
Není zcela jasné, že systémy umělé inteligence, a to zdaleka ne, jsou v předvídání lepší. Chci však zpochybnit první krok tohoto argumentu, tedy způsob, jakým je tento problém chápán.
Je rozhodnutí o kauci výhradně rozhodnutím o tom, zda tato osoba spáchá trestný čin? Zjevně ne. Existují i další úvahy, které jsou relevantní, například jak závažný byl trestný čin, který spáchal?
Jaký dopad bude mít na jejich děti a rodinu, pokud budou drženi ve vazbě? Jaká je kapacita vězeňského systému pro umístění této osoby?
Když tedy přemýšlíme o tomto rozhodnutí o kauci, není to jednorozměrné rozhodnutí založené na předpovědi. Vyžaduje vyvážení celé řady faktorů. A nemusí existovat jediný správný způsob, jak všechny tyto faktory vyvážit. Neexistuje způsob, kdy byste mohli říci: dám všem těmto faktorům číselné hodnocení a pak vyberu možnost, která získá nejvyšší číslo. Takto situace nefunguje, ale takto by fungoval systém umělé inteligence. Obavy zde tedy spočívají v tom, že místo abychom umělou inteligenci použili k řešení našich problémů, změníme povahu našich problémů.
Ta AI nám začne takříkajíc diktovat, jaké jsou problémy, kterým čelíme. Dostáváme věci zpět do popředí.
Hrozba 3: Ohrožení našich hodnotTřetí hrozba, o které jsem chtěl mluvit, se týká našich hodnot jako takových. Lidé, kteří nyní prosazují systémy umělé inteligence, zejména jako náhradu lidského úsilí, mají tendenci zaměřovat se na dvě věci. Za prvé, že tyto systémy AI budou přinášet hodnotné výsledky. Budou produkovat správnou diagnózu rakoviny, dobré rozhodnutí o přijetí do zaměstnání nebo dobrý novinářský text. A za druhé, říkají, že tyto dobré výsledky budou produkovat efektivně, rychleji a s menšími náklady než člověk. Ale toto neúnavné zaměření na hodnotné výsledky vyrobené efektivně ignoruje celou řadu hodnot, na kterých nám záleží.
Hodnoty, které budu nazývat procesními hodnotami. Hodnoty týkající se způsobu, jakým vytváříme hodnotné výsledky. A myslím, že to je v podstatě Kavafyho moudrost v básni Ithaka. Že to, na čem nám záleží, není jen dosažení konečného cíle nejrychlejší cestou. Záleží nám také na tom, abychom tohoto cíle dosáhli správným způsobem. Jak toho cíle dosáhneme. Přijet na Ithaku soukromou helikoptérou je něco úplně jiného než tam dorazit cestou hrdiny, který potká lidožravé obry, Kyklopy a rozzlobeného Poseidona. A někdy je cesta důležitější než cíl. Vzpomeňte si na větu: „A jestli ji najdete chudou, Ithaka vás neošidí.“ To je pravda.
A jak to funguje ve skutečném životě? Jak je možné, že nám záleží na procesu, a ne jen na výsledku?
No, vzpomeňte si na milostné vztahy. Ano, usilujeme o láskyplné vztahy. Ale je velký rozdíl, pokud jsme ve vztahu na základě svobodné volby, která vyjadřuje naši osobnost a náš vkus.
A také na sebe bereme riziko, že uděláme strašnou chybu. To je součástí hodnoty. Na rozdíl od toho, když nám vztah přidělí algoritmus, který byl nastaven tak, aby optimalizoval lidskou kompatibilitu. Nebo se zamyslete nad prací. V práci chceme vytvářet hodnotné výsledky, hodnotné zboží a služby. Chceme mít výsledek v podobě slušného platu. Ale záleží nám také na tom, jak tyto věci vznikají.
Chceme mít možnost pracovat způsobem, který zahrnuje uplatnění dovedností, úsudku, možnost skutečné spolupráce. To jsou procesní hodnoty a ty nikdy nebudou plně kompenzovány představou, že bude existovat univerzální základní příjem, který bude lidem kompenzovat pracovní místa ztracená v důsledku automatizace. Nebo si vezměme poslední příklad, případ soudce. Chceme dobrá právní rozhodnutí, která jsou správná. Ale chceme také rozhodnutí, která jsou činěna ze správných důvodů.
Existuje systém umělé inteligence, který se nazývá Lex Machina, nikoli Ex Machina. A Lex Machina dokáže předvídat výsledek právních případů v americkém patentovém právu stejně dobře jako špičkový americký patentový zástupce. Zní to působivě. Ale pak vám řeknu, že to nedělá tak, že by se podíval na zákon a udělal předpověď.
Podívá se na jméno soudce. Podívá se na výši peněz, které jsou v případu v sázce. Podívá se na advokátní kanceláře, které se na případu podílejí. Tyto skutečnosti jsou pro správný výsledek irelevantní. Takže dostanete správné rozhodnutí, ale špatné odůvodnění.
Je to jako se systémem umělé inteligence, který dokázal rozlišit obrázky huskyho, určitého druhu psa, od vlků. A byl velmi úspěšný. Ale k rozlišení používal přítomnost sněhu na obrázku.
Správný výsledek, špatné uvažování. Chceme také soudce, který, pokud má učinit rozhodnutí, které ovlivní náš život a svobodu, dokáže za toto rozhodnutí převzít osobní odpovědnost. Systémy umělé inteligence, které postrádají racionální autonomii, nemohou nést odpovědnost stejným způsobem.
A to je velmi důležité, protože jednou z věcí, ke kterým soudce potřebujeme, je právě ta strašná práce, kdy musí převzít odpovědnost za rozhodnutí, která mají obrovský dopad na lidský život.
Ale je to také lidská tendence snažit se vyhnout odpovědnosti, kde je to možné.
Systémy umělé inteligence budou novým způsobem, jak se můžeme vyhnout odpovědnosti za strašné následky, které navštěvujeme u svých spoluobčanů.
A nakonec je tu bod o empatii.
I když ke mně bude soudce s umělou inteligencí milosrdný a sníží mi trest kvůli těžkostem, které mě vedly ke spáchání trestného činu, nebude mít tentýž rozsudek stejný význam, jako kdyby ho vynesl lidský soudce.
Protože lidský soudce může tento rozsudek vynést a vyjádřit tak soucitnou reakci na situaci, které jsem čelil.
Mohl by říci: „Tam, ale pro milost Boží jdu já.“ Systém umělé inteligence to říci nemůže.
Nesdílí s námi lidský život.
Mluvil jsem o rizicích, která AI představuje. Nyní se ale možná ptáte, jaká jsou řešení?
Řešení a role demokracieA já si myslím, že při jakémkoli realistickém pohledu neexistuje žádné jednoduché jediné řešení. Například v mém institutu se zabýváme takovými věcmi, jako je potřeba nového práva, práva na lidské rozhodnutí, zvláštního nového práva pro věk AI. Ale pokud existuje ještě jedno zásadní řešení, myslím, že odpověď spočívá v demokracii.
Protože historická zkušenost ukazuje, že technické a technologické inovace nepřinášejí automaticky výhody pro všechny. Přináší prosperitu a další výhody pouze tehdy, pokud podléhají důkladné demokratické kontrole. Demokracie dokáží vytvářet dobrá rozhodnutí lépe než nedemokratické systémy. A také demokracie mají takovou hodnotu procesu, o které jsem mluvil. Pokud společně jako svobodní a rovnoprávní občané uvažujeme o společném dobru a společně dospějeme k rozhodnutí, respektujeme vzájemnou důstojnost způsobem, který jiné systémy nemají. Dobře, ale samozřejmě víme, že žijeme v době demokratické krize, kdy demokracie ztrácí víru.
Žijeme v době, kdy dochází k vzestupu technokracie, kdy je stále více rozhodnutí odebíráno demokratické veřejnosti a svěřováno odborníkům, soudcům, bankéřům. Žijeme v době populismu, kdy lidé hledají silného vládce, který může jednat mimo demokratické struktury. A pokud je do toho všeho zapojena umělá inteligence, mnoho lidí si myslí, že umělá inteligence je pro demokracii toxická, protože umožňuje šíření dezinformací, dezinformací. Podněcuje politickou polarizaci. Chtěl bych skončit pozitivnějším příběhem. A to, že ačkoli je to pravda, existuje také jiná vize, která je pro AI možná, a to umožnit participativnější formu demokracie, která je také lépe informovaná.
Nyní je zřejmá námitka, kterou lidé vznášejí proti participativní demokracii, že prý byla v pořádku pro starověké Atény, ale není v pořádku pro moderní státy vzhledem k jejich velikosti a pluralitnímu charakteru. Myslím si však, že skutečným vrcholem bodu programu by pro nás nyní mělo být využití umělé inteligence a digitálních technologií k umožnění této radikálnější participativní demokracie, kterou potřebujeme.
Takže si můžete představit nástroje umělé inteligence, které občanům poskytují informace přizpůsobené jejich specifickému stylu učení. Mohli byste si představit, že by sdružovaly náhodné vzorky dotčených skupin obyvatelstva a podporovaly a moderovaly jednání a debatu. A mohly by šířit konkurenční návrhy a identifikovat body shody, a to nejen prosté většiny, ale body shody, které jsou napříč různými demokratickými skupinami. Možná si teď řeknete, že to zní jako sen filozofů, ale ve skutečnosti to už existuje.
Například na Tchaj-wanu vzniklo hnutí zdola, které se stalo vládou. A toto hnutí zdola využívalo online platformu zvanou Polis. Zajímalo by mě, kde k tomu názvu přišli. Polis umožňuje občanům, aby se zapojili online do úvah a debat o otázkách typu: Jaká by měla být naše politika vůči Uberu?
A jejich úvahy se pak skutečně promítají do konečné podoby legislativy. Myslím si, že žijeme v době, kdy se lidé cítí stále více bezmocní a podléhají silám, které nemohou ovlivnit, nebo jim dokonce nerozumějí.
ZávěrA myslím, že existuje vážná hrozba, že umělá inteligence tento stav znemožnění ještě zhorší tím, že vytvoří odlidštěný svět, v němž bude uplatňování našich osobitých lidských schopností odsunuto na okraj. A to vše se bude dít pod šťastným heslem, že jde o uspokojení našich spotřebitelských preferencí. A za tím vším budou stát mocné ekonomické zájmy. Nebude snadné se tomu bránit, ale boj proti tomu musí začít přemýšlením o tom, jaké naše nejhlubší hodnoty jsou zde v sázce. Boj musí začít návratem k Sokratově otázce. Děkuji.
February 16, 2025
Zpráva o stavu AI pro jaro 2025
Ještě nedávno vypadalo AI jako velmi přehledné závodiště. Se značným náskokem vede OpenAI, snaží se dotahovat prostřednictvím obrovských investic Muskův xAI a Google, který má vlastní AI model Gemini. K tomu je obchodně velmi úspěšný Antrhopic se svým modelem Claude. Pokud nás mohlo něco zarazit, pak snad jen to, že Google přes veškerý náskok v odvětví a obrovské investice do AI není vedoucí hybnou silou.
My ale vynecháme akademické debaty o tom, co a jak s Google Gemini, proč se závodů nezúčastní Microsoft, Meta nebo Amazon. My se podíváme na výsledky pařížského summitu, pozici Francie a Německa, nové eurounijní AI strategie a také na to, jak situaci mění snažení v Číně.
Materiál je rozsáhlejší, 15 stran v PDF, cca 30 000 znaků. Proto je ke stažení v PDF a ePub.
Platba za zprávuCena zprávy je 100 Kč. Zaplatit můžete buďto přes QR platbu nebo službou Buy me a Coffee. Přednastavenou částku 100 Kč můžete libovolně změnit nahoru (i dolů, pokud vám zpráva nebyla užitečná).
[image error]
Proč placení za zprávu? Sepsání takové zprávy je náročné nejenom časově, ale také finančně jak na předplatné služeb, tak na provoz a testování LLM modelů.
Stažení zprávyPokud jste již zaplatili (nebo se rozhodli zaplatit později), tak si můžete zprávu stáhnout na svůj počítač ve formátu PDF nebo ePub zde:
formát PDF (zobrazení spíše na počítači) formát ePub (elektronická kniha, zobrazení na tabletu nebo mobilu)Případnou odezvu na zprávu můžete poslat emailem na zandl@marigold.cz.