Sémantické prostory českého zpravodajství

Algoritmus word2vec, zjednodušeně řečeno, umožňuje vyhledat ve velkých textových korpusech sémanticky blízká slova. V podstatě jde o natrénovanou neuronovou síť, která se snaží předpovědět, jaká slova budou tvořit kontext konkrétního slova.

My jsme se v naší aplikaci inspirovali projektem serveru Pro Publica How Machines Learn to Be Racist, který naučil tuto neuronovou síť najít blízká slova v korpusech amerických médií.

Pro naše účely jsme vytvořili korpusy pro pět skupin českých médií, u nichž jsme měli dostatek dat. Proto oproti původní typologii nejsou některá média zahrnuta a média zařazená do hlavního proudu jsme rozdělili na dvě skupiny. Do první jsme zařadili samostatně Novinky.cz, které mají spíš středolevé a levicové publikum, do druhé pak média se spíše středopravicovým a pravicovým publikem.

Antisystémové: Nová republika, Vlastenecké noviny, Rukojmí, Svobodné noviny, AC 24, Czech Free Press, ČeskoAktuálně, Aeronet, NWOO, Protiproud, Bez Politické Korektnosti, Outsider Media a Zvědavec
Politický bulvár: Parlamentní listy, První zprávy a Eurozprávy
Bulvár: Blesk a Aha Online
Hlavní proud - levý střed: Novinky
Hlavní proud - pravý střed: iHned, iDnes, Lidovky a Aktuálně

Analyzované korpusy obsahují všechny články publikované na uvedených serverech v době mezi zářím 2017 a zářím 2018. Pro lepší výsledek jsme strojově převedli všechna tato slova do základních tvarů (tzv. lemmatizovali) pomocí knihovny UDPipe.

Výsledky jsou seřazeny podle abstraktní vzdálenosti. Tučně jsou pak zvýrazněna ta slova, která jsou typická pro jednotlivé typy médií.

Tento projekt byl připraven ve spolupráci se Studii nových médií FF UK.

NFNZ vydává studii „Samoregulační mediální rady: zkušenosti z novinářské a vydavatelské spolupráce v Evropě“

Nová studie o evropských zkušenostech se samoregulací médií ↗

Spustili jsme grantovou výzvu "Podpora lokální žurnalistiky 2025"

Přihlášky je možné podávat online do 31. března 2025 ↗

Média

Granty

NFNZ

Cookies

Tyto webové stránky používají k poskytování svých služeb soubory cookies. Bližší informace o cookies získáte po kliknutí na tlačítko „Detailní nastavení“. Můžete si nastavit, které cookies budeme moci používat nebo nám udělit souhlas s používáním všech cookies kliknutím na tlačítko „Povolit všechny“. Nastavení cookies můžete kdykoliv změnit v zápatí našich webových stránek. Více o ochraně osobních údajů zde.

Bez nezávislých médií se nemůžeme správně rozhodovat.

Podpořte nás.

250 Kč 500 Kč 2000 Kč Přes QR kód

Přihlaste se k odběru našeho newsletteru ↗

[email protected]

IČ: 5294258

Ovocný trh 579/6

110 00 Praha 1

Česká republika

Ochrana osobních údajů

Sémantické prostory českého zpravodajství

Doporučené

Registrujte se na Novinářské fórum 2025

Tisková zpráva: NFNZ vydal update Mapy médií

NFNZ vydává studii „Samoregulační mediální rady: zkušenosti z novinářské a vydavatelské spolupráce v Evropě“

Spustili jsme grantovou výzvu "Podpora lokální žurnalistiky 2025"

Cookies