Program na chytání opisovačů se nedá snadno ošálit

Josef Tuček
18. 10. 2009 11:45
"Tvořivou" práci studentů s cizím textem odhalí software už na dvacítce škol
Detektiv.
Detektiv. | Foto: Ondřej Besperát

Brno - Jak moc se při vypracovávání písemných prací na vysokých školách podvádí?

Tuto otázku připomněl skandál na Právnické fakultě Západočeské univerzity v Plzni, kde ovšem opisování "samostatných" prací bylo pomalu tím nejmenším proviněním, jaké se na škole objevovalo.

Dvacítka českých vysokých škol, a s nimi dvě školy slovenské, využívá počítačový program, který sestavili na Masarykově univerzitě v Brně. Ten najde opisovače, a nedá se tak snadno zmást.

Netřeba snad připomínat, že Západočeská univerzita mezi školami, které program na hledání podvodníků chtějí, samozřejmě nefiguruje.

Wikipedie už je, celý internet bude

První verze softwaru vznikla v roce 2006. "Řekli jsme si, že máme na škole kvalitní informační systém, v němž jsou studentům k dispozici všechny závěrečné práce a studijní materiály, ale na druhé straně nechceme, aby jej uživatelé zneužívali," říká Jitka Brandejsová z týmu, který kontrolní program vyvinul.

Kdo program využívá

  • Akademie múzických umění v Praze
  • Bankovní institut vysoká škola
  • Brno International Business School
  • Česká zemědělská univerzita v Praze
  • Ekonomická univerzita v Bratislavě
  • Janáčkova akademie múzických umění v Brně
  • Jihočeská univerzita v Českých Budějovicích
  • Masarykova univerzita
  • Ostravská univerzita v Ostravě
  • Slezská univerzita v Opavě
  • Univerzita Hradec Králové
  • Univerzita Jana Evangelisty Purkyně v Ústí nad Labem
  • Univerzita Komenského v Bratislavě
  • Univerzita Palackého v Olomouci
  • Univerzita obrany
  • Univerzita Tomáše Bati ve Zlíně
  • Vysoká škola báňská - Technická univerzita Ostrava
  • Vysoká škola ekonomická v Praze
  • Vysoká škola finanční a správní
  • Vysoká škola polytechnická Jihlava
  • Vysoká škola technická a ekonomická v Českých Budějovicích
  • Vysoká škola uměleckoprůmyslová v Praze

Zdroj: http://www.theses.cz/

Sestavili tedy počítačový program, který dokáže porovnat text diplomové práce s jinými ve školním informačním systému a zjistit, zda se z nich neopisovalo neboli zda je práce původní.

Projekt se postupně rozrostl, takže dnes čerpá z databáze diplomových prací dvaadvaceti škol (http://theses.cz/). Deset škol jej podobně používá i ke kontrole seminárních prací (http://odevzdej.cz/). Do srovnávací databáze jsou přidány také texty z internetové encyklopedie Wikipedie a dalších zdrojů, které by studenti mohli pro opisování zneužít.

"V testovací verzi nyní máme také porovnávání textu s veškerým obsahem na internetu. Předpokládáme, že jej do praxe uvedeme v příštím roce," doplňuje Jitka Brandejsová.

Zpřeházený slovosled nestačí

Nechce však jít do úplných podrobností: "Je to naše know-how, které úplně neprozrazujeme," podotýká.

Podstatou je, že program analyzuje podobnosti v úsecích textu. Neboli je schopen najít, ze kterých jiných děl v databázi byly které úseky porovnávaného textu převzaty. Podvodníkovi ale nepomůže, ani když zpřehází slovosled a pár slov zamění za synonyma - i tohle program objeví.

"Prakticky neexistují dva lidé, kteří by měli natolik stejný styl psaní, že by jednu myšlenku vyjádřili stejně. Pokud náš program najde shodu, znamená to, že se opisovalo z jednoho z těchto dokumentů, případně z dalšího, třetího zdroje," hodnotí inženýrka Brandejsová.

Program dokonce rozpozná, zda se neopisovalo ze slovenštiny do češtiny a naopak. U ostatních jazyků však kontrola zatím neexistuje. Pokud tedy někdo práci jenom přeloží z cizího jazyka do češtiny a vydává ji za vlastní, software na to nepřijde. Počítačové překladače nejsou tak dokonalé, aby umožnily takové srovnání. Alespoň prozatím.

Skenování starších diplomek

V dnešní době se diplomové i seminární práce zpravidla odevzdávají v elektronické podobě, takže se dají snadno do databáze uložit k dalšímu porovnávání. Ale mnohé školy skenují také starší diplomky a jejich text do databází přenášejí.

Riziko pro opisovače, že budou odhaleni, se tedy stále zvyšuje.

Samozřejmě, ne každá podobnost textu znamená nepovolené opisování. Pokud například autor cituje z jiného zdroje, nebo se odvolává třeba na přesné znění zákonů, program upozorní na shodu hodnotitele. Ten pak musí sám posoudit, jestli jsou citáty správně označeny a kompilace jiných textů oprávněná, a jaký je vlastní přínos autora práce.

"Nemohu mluvit za jiné vysoké školy. Tady na Masarykově univerzitě jsme zatím odhalili dvacet osm opsaných diplomových prací odevzdaných k obhajobě," vyčísluje Jitka Brandejsová.

 

Právě se děje

Další zprávy