(no subject)

Feb 02, 2014 18:09

Разбирала ссылки, заодно решила поделиться с общественностью накопленным добром. Пост регулярно обновляется.


История и литература
http://svr-lit.niv.ru/ - материалы по литературе Средних веков и Возрождения. На сайте есть ссылки на другие периоды
http://feb-web.ru/ - русская литература и фольклор
http://cudl.lib.cam.ac.uk/collections/ - библиотека Кембриджа
http://www.vostlit.info/Texts/Dokumenty/index.phtml?id=2070  - средневековые исторические источники (на русском, к сожалению)
http://www.philol.msu.ru/~tezaurus/library.php?view=a - литературоведение
http://www.bartleby.com/211/ - история английской и американской литературы (CAMBRIDGE HISTORY OF ENGLISH AND AMERICAN LITERATURE)
http://www.esawyer.org.uk/about/index.html - Anglo-Saxon Charters
http://www.british-history.ac.uk/Default.aspx - British History
http://www.mediaevum.de/haupt2.htm - портал по медиевистике
http://www.mgh.de/ - Monumenta Germaniae Historica
http://www.regionalgeschichte.net/bibliothek/linksammlung/thematische-links/deutsche-landesgeschichte.html - Links zur Deutschen Landesgeschichte
http://www.libraryireland.com/about.php - free information on all aspects of Ireland


Корпуса, словари, атласы и монографии
http://www.ruscorpora.ru/ - нац. корпус русского языка
http://www.slavatlas.org/index.html - общеславянский лингвистический атлас
http://www.koeblergerhard.de/anwbhinw.html - словарь древненорвежского
http://www.gutenberg.org/ebooks/10625?msg=welcome_stranger - A Concise Dictionary of Middle English
http://quod.lib.umich.edu/c/cme/ - Middle English texts
http://www.utexas.edu/cola/centers/lrc/ - материалы по и.-е. языкам
http://bosworth.ff.cuni.cz/ - словарь древнеанглийского
http://www.natcorp.ox.ac.uk/ - The British National Corpus
http://www.dwds.de/  - немецкий словарь + корпуса
http://www.mhdwb-online.de/index.html - словарь средневерхненемецкого
http://www.lextutor.ca/concordancers/concord_g.html - немецкий корпус
http://www.atlas-alltagssprache.de/  - Atlas zur deutschen Alltagssprache
http://www.idiotikon.ch/ - словарь швейцарского немецкого
http://woerterbuchnetz.de/DWB/ - словарь братьев Гримм (онлайн)
http://alexmidd.co.uk/Marmaria/ohg/ohg_primer_contents.htm#contents - краткий обзор древневерхненемецкого (с текстами)
http://korpora.zim.uni-due.de/Fnhd/quellen.html - Quellenverzeichnis des Digitalen Fruehneuhochdeutschkorpus
https://abdn.ac.uk/skaldic/db.php - Skaldic Poetry of the Scandinavian Middle Ages
http://www.ethnologue.com/ - статистика по языкам мира
http://www.alt.germ.uni-tuebingen.de/abteilungen/mediaevistik/Materialien/Merkverse/index.html#Abteilung1 - Mediävistische Merkverse (мнемонические стихи на тему истории немецкого языка)
http://www.utexas.edu/cola/centers/lrc/books/piep00.html - Proto-Indo-European Phonology by Winfred P. Lehmann
https://korpling.german.hu-berlin.de/annis3/ - корпус древневерхненемецкого
http://mhdbdb.sbg.ac.at/index.en.html - Middle High German Conceptual Database.


Тексты
http://www.fordham.edu/Halsall/sbook.asp - средневековые тексты (по большей части в переводах на современные языки)
http://www.fbit.ru/free/myth/texty/mabinogi/home.htm - Мабиногион (на русском)
http://bestoflegends.org/index.html - европейские легенды
http://titus.uni-frankfurt.de/indexe.htm?/texte/texte2.htm#mndl - корпус текстов на индоевропейских языках
http://www.maryjones.us/ctexts/index.html - кельтские тексты (с сопроводительными переводами на английский)
http://celt.ucc.ie/index.html - ирландские тексты
http://www.ucd.ie/tlh/ - ирландские тексты
http://www.gutenberg.org/cache/epub/2383/pg2383.html -The Canterbury Tales
http://www.librarius.com/cantales.htm - они же (оригинал + построчный перевод)
http://quod.lib.umich.edu/cgi/t/text/text-idx?c=cme;idno=MaloryWks2 - «Смерть Артура», оригинал (в общем корпусе среднеанглийских текстов)
http://www.beowulfepic.com/ - сайт о «Беовульфе»
http://www.textlog.de/philosophie.html - тексты по философии (немецкий)
http://www.russianplanet.ru/filolog/epos/index.htm - европейские и восточные эпосы (русский)
http://www.hs-augsburg.de/~harsch/augustana.html - тексты на латыни, греческом, английском, немецком, французском, итальянском
http://lutherbibel.net/ - Библия Лютера
http://www.handschriftencensus.de/ - немецкие средневековые рукописи
http://anglosaxonpoetry.camden.rutgers.edu/ - Old English poetry (в переводе на современный английский)


Разное
http://at.mansbjorkman.net/ - письменности Амана (+ шрифты!)
http://conjugation.com/ - спряжение глаголов для ленивых (разные языки)
http://baharna.com/celtic/index.htm#bibliography - краткий путеводитель по Туата Де Дананн (со ссылками на литературу)



NLP

Sprachtechnologie in den Digital Humanities https://www.coursera.org/learn/digital-humanities/home/welcome
ПО для построения частотных списков лексики: AntConc http://www.laurenceanthony.net/software/antconc/.

Морфологические частеречные разметчики:
FreeLing http://nlp.lsi.upc.edu/freeling/
Stanford Log-linear Part-Of-Speech Tagger http://nlp.stanford.edu/software/tagger.shtml
TreeTagger http://corpus.leeds.ac.uk/mocky/
FreeLing: http://nlp.lsi.upc.edu/freeling/index.php?option=com_content&task=view&id=18&Itemid=47

Ресурсы и библиотеки для реализации FSA и FST
PC-Kimmo - http://www-01.sil.org/pckimmo/
foma - https://code.google.com/p/foma/
Xerox Finite-State Tool (Lauri Karttunen, Tamás Gaál, and André Kempe) - http://www.cis.upenn.edu/~cis639/docs/xfst.html
FST Morphology - http://web.stanford.edu/~laurik/fsmbook/home.html

Web scraping (Texte von HTML Seiten extrahieren)
BootCaT (Tool, um eigene Korpora basierend auf WEB-Inhalten zu erstellen)
XML Einführung (Tutorial w3schools)
Инструменты для немецкого языка https://pub.cl.uzh.ch/wiki/public/kitt
Wortsegmentierung an einem deutschen Text (interaktive Übung im CLab)
TreeTagger (Part-of-Speech-Tagger für verschiedene Sprachen)
Tokenisierung (CLab)
TreeTagger (Part-Of-Speech Tagger für verschiedene Sprachen)
TüBa (Baumbank aus syntaktisch-annotiertem Korpus)
Tiger Treebank (POS-Tagging und syntaktische Analyse)
STTS Tagset (Stuttgart-Tübingen-Tagset)
Porter Stemmer (Stemming zum Abtrennen morphologischer Flexionsendungen)
Durm Lemmatizer (Lemmatisierung von Substantiven)
CONNEXOR-Tagger (NLP - Natural Language Processing - Tagger)
GeoNames (Geographische Datenbank für Ortsnamen)
Wikidata (hilfreiche Datenbank für Named Entity Recognition)
TimeML (Markup Language für Zeitausdrücke)
Mate Tools (Toolkit für statistisches Natural Language Processing)
Conditional Random Fields (Tutorial CLab zum Taggen von sequenziellen Daten)
Universales Dependenzformat (multilinguale Baumbanken mit Annotationen)
CONNEXOR-Tagger (NLP - Natural Language Processing - Tagger)
TIGER-Treebank (POS-Tagging und syntaktische Analyse)
ParZu (The Zurich Dependency Parser for German)
WebAnno (und ein dazugehöriges YouTube Tutorial)
EXMARaLDA (Annotation von digitalen Audio- und Videodaten)
Arborator (Annotation von syntaktischen Dependenzen)
RSTTool (Annotation der rhetorischen Textstruktur)
ANNIS Framework (Suche, Visualisierung und Export von annotierten Korpora)
Artigo (Annotation von kunsthistorischen Bildern)
TypeWright (Manuelles Validieren von OCR für englische Literatur)
Codeswitching (Wechsel zwischen zwei Sprachen)
EM-Algorithmus (Expectation Maximization)
lingua-ident (Spracherkennungs-Tool)
InterText (Alignment-Tool mit graphischer Benutzeroberfläche für Satzalignierung in parallelen Korpora)
HunAlign (Alignment-Tool für Satzalignierung in parallelen Korpora)
BleuAlign (Alignment-Tool für Wortalignierung in parallelen Korpora)
GIZA++ (Alignment-Tool für Wortalignierung in parallelen Korpora)
The Classical Language Toolkit http://cltk.org/



Python

Learn to Program: The Fundamentals https://www.coursera.org/learn/learn-to-program/home/welcome
NLTK https://www.nltk.org/book/ch01.html
langid.py (Python-Programm zur automatischen Spracherkennung von Texten)
Основы программирования на Python https://www.coursera.org/learn/python-osnovy-programmirovaniya/home/welcome
Интерактивный учебник языка Питон http://pythontutor.ru/



XML

Основы XML для начинающих пользователей https://www.ibm.com/developerworks/ru/library/x-newxml/index.html
https://tei-c.org/
https://msiter.ru/tutorials/uchebnik-xml-dlya-nachinayushchih/chto-takoe-xml
XML - Einführung (Extensible Markup Language Tutorial)
XML - Syntax (w3schools)
Zeichenkodierung (ASCII, Unicode, UTF-8, UTF-16, UTF-32)
TextGrid (TEI-XML Editor für digitales Editieren und Publizieren)



Визуализация
OpenLayers 3
Leaflet (JavaScript Library)
Gephi (Visualisierungssoftware für Graphen und Netzwerke)
GraphViz (Graph Visualisierungssoftware)
D3.js (Visualisierung mit JavaScript)
P5.js (Visualisierung mit JavaScript)
Processing (Visualisierungssoftware)
Bubenhofer: Geokollokationen.
Nachtrag: Vega, Lyra, Polestar und Voyager. (Vega ist eine abstrakte Beschreibungssprache für Visualisierungen, die dann automatisch in HTML 5, Canvas oder SVG realisiert werden)
Sprachtechnologie in den Digital Humanities https://www.coursera.org/learn/digital-humanities/home/welcome

язык мой, дети тумана, тайны третьей планеты, понедельник начинается в субботу, translation is a myth, Éire, лингвистика, Dеr Dаtiv ist dem Gеnitiv sein Tоd

Previous post Next post
Up