Main Page: Porovnání verzí

Z sumava-corpus
Přejít na: navigace, hledání
Řádka 27: Řádka 27:
 
==== PrefBank ====
 
==== PrefBank ====
  
Je souborem předmluv, doslovů a částečně také kapitol týkajících se obecné charakteristiky  
+
Je souborem předmluv, doslovů a částečně také kapitol týkajících se obecné charakteristiky
 
+
 
pohoří vypsaných z průvodců, fotografických publikací, memoárů a dalších pramenů  
 
pohoří vypsaných z průvodců, fotografických publikací, memoárů a dalších pramenů  
 
 
týkajících se Šumavy. Sestává z téměř 80 textů vzniklých mezi roky 1883 a 2013.
 
týkajících se Šumavy. Sestává z téměř 80 textů vzniklých mezi roky 1883 a 2013.
 
 
Účelem PrefBank je zastávat funkci referenčního materiálu MediaBank a zároveň  
 
Účelem PrefBank je zastávat funkci referenčního materiálu MediaBank a zároveň  
 
 
reprezentovat materiál reflektující problematiku Šumavy dávno před vznikem národního  
 
reprezentovat materiál reflektující problematiku Šumavy dávno před vznikem národního  
 
 
parku.
 
parku.
  
Řádka 42: Řádka 37:
  
 
Je souborem předmluv a doslovů k především beletristickým dílům Karla Klostermanna.  
 
Je souborem předmluv a doslovů k především beletristickým dílům Karla Klostermanna.  
 
 
Celkem 19 textů odráží vývoj vnímání Šumavy od počátku 20. století. Stejně jako v případě  
 
Celkem 19 textů odráží vývoj vnímání Šumavy od počátku 20. století. Stejně jako v případě  
 
 
PrefBank plní KlosterBank důležitou funkci referenčního materiálu.
 
PrefBank plní KlosterBank důležitou funkci referenčního materiálu.
  
Řádka 50: Řádka 43:
  
 
Všechny tři textové banky vznikly jako materiálová báze pro můj výzkum, který se věnuje  
 
Všechny tři textové banky vznikly jako materiálová báze pro můj výzkum, který se věnuje  
 
 
dynamice mediálního diskurzu o Národním parku Šumava. Zejména MediaBank využívám  
 
dynamice mediálního diskurzu o Národním parku Šumava. Zejména MediaBank využívám  
 
 
jako podklad pro kvantitativní analýzu, jejímž účelem je odhalovat frekventovaná sémanticky  
 
jako podklad pro kvantitativní analýzu, jejímž účelem je odhalovat frekventovaná sémanticky  
 
 
relevantní lexikálně-gramatická schémata. Zjednodušeně řečeno: s pomocí MediaBank je  
 
relevantní lexikálně-gramatická schémata. Zjednodušeně řečeno: s pomocí MediaBank je  
 
 
například dobře možné odkrývat komunikační stereotypy či argumentační strategie, které jsou  
 
například dobře možné odkrývat komunikační stereotypy či argumentační strategie, které jsou  
 
 
pro debatu o Národním parku Šumava klíčové.
 
pro debatu o Národním parku Šumava klíčové.
 
 
Rozhraní, které jsme pro korpus zvolili, však také umožňuje například velmi rychle  
 
Rozhraní, které jsme pro korpus zvolili, však také umožňuje například velmi rychle  
 
 
a pohodlně zjistit, v jakém období a v jakých médiích ten který aktér publikoval, s kým  
 
a pohodlně zjistit, v jakém období a v jakých médiích ten který aktér publikoval, s kým  
 
 
konkrétní deník rád dělá rozhovory nebo jednoduše, kdy se o Šumavě nejvíc psalo. Prostředí  
 
konkrétní deník rád dělá rozhovory nebo jednoduše, kdy se o Šumavě nejvíc psalo. Prostředí  
 
 
MediaWiki navíc nabízí komplexní vyhledávání na standardním „googlovském“ principu.
 
MediaWiki navíc nabízí komplexní vyhledávání na standardním „googlovském“ principu.
  
 
=== Jak citovat ===
 
=== Jak citovat ===
  
Při odkazování na celý web:
+
==== Při odkazování na celý web ====
  
 
Sumava-corpus [on-line]. [citováno ze dne 8. 8. 2015]. Michal L. Hořejší. Dostupný na  
 
Sumava-corpus [on-line]. [citováno ze dne 8. 8. 2015]. Michal L. Hořejší. Dostupný na  
Řádka 77: Řádka 61:
 
<http://sumava-corpus.narra.eu>.
 
<http://sumava-corpus.narra.eu>.
  
Při odkazování na určitý zdroj:
+
==== Při odkazování na určitý zdroj ====
  
 
Sumava-corpus / MediaBank [on-line]. [citováno ze dne 8. 8. 2015]. Michal L. Hořejší. Dostupný na  
 
Sumava-corpus / MediaBank [on-line]. [citováno ze dne 8. 8. 2015]. Michal L. Hořejší. Dostupný na  

Verze z 20. 8. 2015, 08:39

Korpus textů o Šumavě

O korpusech

Stránka sumava-corpus je prostředím, které sdružuje různé typy textových bank sdílejících shodné téma „Šumava“.

MediaBank

Centrální bankou je MediaBank, která sestává z textů vzniklých v letech 1991 až 2010 a spadajících do shodného, mediálního (makro)žánru. Převážná většina sebraných textů pochází z českých tištěných médií nebo jejich internetových verzí. Nejfrekventovanějšími zdroji jsou regionální mutace velkých deníků a částečně větší měsíčníky, v menší míře se zde vyskytují také tiskové zprávy a několik textů pocházejících z on-line blogů. Korpus doplňují přepisy televizních a rozhlasových pořadů. Celkově obsahuje necelých 6800 textů o rozsahu 2,9 mil. slov. Ačkoli korpus jistě není kompletní, lze jej považovat za reprezentativní.

Rozložení textů v čase je patrné z tabulky:

Rok 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Počet 1 1 40 30 50 40 50 15 100 300
Rok 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Počet 450 400 450 350 150 550 1000 1000 1000 800
Celkem 6800

Výběr textů do MediaBank byl podmíněn pouze nutným výskytem jednotky „Šumava. Výchozí materiál – v nejstarších obdobích novinové výstřižky, v těch mladších pak výsledky monitoringů médií – mi laskavě poskytl archiv Hnutí Duha; na zpracování materiálu se podíleli převážně studenti FF UK, jejichž práce byla hrazena prostřednictvím účelového stipendia, které mi FF UK na tvorbu korpusu poskytla. Webovou stránku realizoval Michal Mocňák a je součástí projektu Narra.

PrefBank

Je souborem předmluv, doslovů a částečně také kapitol týkajících se obecné charakteristiky pohoří vypsaných z průvodců, fotografických publikací, memoárů a dalších pramenů týkajících se Šumavy. Sestává z téměř 80 textů vzniklých mezi roky 1883 a 2013. Účelem PrefBank je zastávat funkci referenčního materiálu MediaBank a zároveň reprezentovat materiál reflektující problematiku Šumavy dávno před vznikem národního parku.

KlosterBank

Je souborem předmluv a doslovů k především beletristickým dílům Karla Klostermanna. Celkem 19 textů odráží vývoj vnímání Šumavy od počátku 20. století. Stejně jako v případě PrefBank plní KlosterBank důležitou funkci referenčního materiálu.

Účel korpusů

Všechny tři textové banky vznikly jako materiálová báze pro můj výzkum, který se věnuje dynamice mediálního diskurzu o Národním parku Šumava. Zejména MediaBank využívám jako podklad pro kvantitativní analýzu, jejímž účelem je odhalovat frekventovaná sémanticky relevantní lexikálně-gramatická schémata. Zjednodušeně řečeno: s pomocí MediaBank je například dobře možné odkrývat komunikační stereotypy či argumentační strategie, které jsou pro debatu o Národním parku Šumava klíčové. Rozhraní, které jsme pro korpus zvolili, však také umožňuje například velmi rychle a pohodlně zjistit, v jakém období a v jakých médiích ten který aktér publikoval, s kým konkrétní deník rád dělá rozhovory nebo jednoduše, kdy se o Šumavě nejvíc psalo. Prostředí MediaWiki navíc nabízí komplexní vyhledávání na standardním „googlovském“ principu.

Jak citovat

Při odkazování na celý web

Sumava-corpus [on-line]. [citováno ze dne 8. 8. 2015]. Michal L. Hořejší. Dostupný na

<http://sumava-corpus.narra.eu>.

Při odkazování na určitý zdroj

Sumava-corpus / MediaBank [on-line]. [citováno ze dne 8. 8. 2015]. Michal L. Hořejší. Dostupný na

<http://sumava-corpus.narra.eu>.

Sumava-corpus by měl sloužit nejen jako snadno dostupný materiál pro vysokoškolské

studenty zabývající se (například ve svých diplomových pracích) analýzou diskurzu, mediální

komunikací ap., ale také novinářům, kteří ve svých článcích o šumavské problematice

zpravidla vykazují trapnou neznalost faktů a historie. Korpusy by však měly sloužit také těm,

které jednoduše zajímá, jak se o Šumavě v minulosti mluvilo.

Michal L. Hořejší

mlh.seznam(at)seznam.cz