Разбирала ссылки, заодно решила поделиться с общественностью накопленным добром. Пост регулярно обновляется.
История и литература
http://svr-lit.niv.ru/ - материалы по литературе Средних веков и Возрождения. На сайте есть ссылки на другие периоды
http://feb-web.ru/ - русская литература и фольклор
http://cudl.lib.cam.ac.uk/collections/ - библиотека Кембриджа
http://www.vostlit.info/Texts/Dokumenty/index.phtml?id=2070 - средневековые исторические источники (на русском, к сожалению)
http://www.philol.msu.ru/~tezaurus/library.php?view=a - литературоведение
http://www.bartleby.com/211/ - история английской и американской литературы (CAMBRIDGE HISTORY OF ENGLISH AND AMERICAN LITERATURE)
http://www.esawyer.org.uk/about/index.html - Anglo-Saxon Charters
http://www.british-history.ac.uk/Default.aspx - British History
http://www.mediaevum.de/haupt2.htm - портал по медиевистике
http://www.mgh.de/ - Monumenta Germaniae Historica
http://www.regionalgeschichte.net/bibliothek/linksammlung/thematische-links/deutsche-landesgeschichte.html - Links zur Deutschen Landesgeschichte
http://www.libraryireland.com/about.php - free information on all aspects of Ireland
Корпуса, словари, атласы и монографии
http://www.ruscorpora.ru/ - нац. корпус русского языка
http://www.slavatlas.org/index.html - общеславянский лингвистический атлас
http://www.koeblergerhard.de/anwbhinw.html - словарь древненорвежского
http://www.gutenberg.org/ebooks/10625?msg=welcome_stranger - A Concise Dictionary of Middle English
http://quod.lib.umich.edu/c/cme/ - Middle English texts
http://www.utexas.edu/cola/centers/lrc/ - материалы по и.-е. языкам
http://bosworth.ff.cuni.cz/ - словарь древнеанглийского
http://www.natcorp.ox.ac.uk/ - The British National Corpus
http://www.dwds.de/ - немецкий словарь + корпуса
http://www.mhdwb-online.de/index.html - словарь средневерхненемецкого
http://www.lextutor.ca/concordancers/concord_g.html - немецкий корпус
http://www.atlas-alltagssprache.de/ - Atlas zur deutschen Alltagssprache
http://www.idiotikon.ch/ - словарь швейцарского немецкого
http://woerterbuchnetz.de/DWB/ - словарь братьев Гримм (онлайн)
http://alexmidd.co.uk/Marmaria/ohg/ohg_primer_contents.htm#contents - краткий обзор древневерхненемецкого (с текстами)
http://korpora.zim.uni-due.de/Fnhd/quellen.html - Quellenverzeichnis des Digitalen Fruehneuhochdeutschkorpus
https://abdn.ac.uk/skaldic/db.php - Skaldic Poetry of the Scandinavian Middle Ages
http://www.ethnologue.com/ - статистика по языкам мира
http://www.alt.germ.uni-tuebingen.de/abteilungen/mediaevistik/Materialien/Merkverse/index.html#Abteilung1 - Mediävistische Merkverse (мнемонические стихи на тему истории немецкого языка)
http://www.utexas.edu/cola/centers/lrc/books/piep00.html - Proto-Indo-European Phonology by Winfred P. Lehmann
https://korpling.german.hu-berlin.de/annis3/ - корпус древневерхненемецкого
http://mhdbdb.sbg.ac.at/index.en.html - Middle High German Conceptual Database.
Тексты
http://www.fordham.edu/Halsall/sbook.asp - средневековые тексты (по большей части в переводах на современные языки)
http://www.fbit.ru/free/myth/texty/mabinogi/home.htm - Мабиногион (на русском)
http://bestoflegends.org/index.html - европейские легенды
http://titus.uni-frankfurt.de/indexe.htm?/texte/texte2.htm#mndl - корпус текстов на индоевропейских языках
http://www.maryjones.us/ctexts/index.html - кельтские тексты (с сопроводительными переводами на английский)
http://celt.ucc.ie/index.html - ирландские тексты
http://www.ucd.ie/tlh/ - ирландские тексты
http://www.gutenberg.org/cache/epub/2383/pg2383.html -The Canterbury Tales
http://www.librarius.com/cantales.htm - они же (оригинал + построчный перевод)
http://quod.lib.umich.edu/cgi/t/text/text-idx?c=cme;idno=MaloryWks2 - «Смерть Артура», оригинал (в общем корпусе среднеанглийских текстов)
http://www.beowulfepic.com/ - сайт о «Беовульфе»
http://www.textlog.de/philosophie.html - тексты по философии (немецкий)
http://www.russianplanet.ru/filolog/epos/index.htm - европейские и восточные эпосы (русский)
http://www.hs-augsburg.de/~harsch/augustana.html - тексты на латыни, греческом, английском, немецком, французском, итальянском
http://lutherbibel.net/ - Библия Лютера
http://www.handschriftencensus.de/ - немецкие средневековые рукописи
http://anglosaxonpoetry.camden.rutgers.edu/ - Old English poetry (в переводе на современный английский)
Разное
http://at.mansbjorkman.net/ - письменности Амана (+ шрифты!)
http://conjugation.com/ - спряжение глаголов для ленивых (разные языки)
http://baharna.com/celtic/index.htm#bibliography - краткий путеводитель по Туата Де Дананн (со ссылками на литературу)
NLP
Sprachtechnologie in den Digital Humanities
https://www.coursera.org/learn/digital-humanities/home/welcomeПО для построения частотных списков лексики: AntConc
http://www.laurenceanthony.net/software/antconc/.
Морфологические частеречные разметчики:
FreeLing
http://nlp.lsi.upc.edu/freeling/Stanford Log-linear Part-Of-Speech Tagger
http://nlp.stanford.edu/software/tagger.shtmlTreeTagger
http://corpus.leeds.ac.uk/mocky/FreeLing:
http://nlp.lsi.upc.edu/freeling/index.php?option=com_content&task=view&id=18&Itemid=47 Ресурсы и библиотеки для реализации FSA и FST
PC-Kimmo -
http://www-01.sil.org/pckimmo/foma -
https://code.google.com/p/foma/Xerox Finite-State Tool (Lauri Karttunen, Tamás Gaál, and André Kempe) -
http://www.cis.upenn.edu/~cis639/docs/xfst.htmlFST Morphology -
http://web.stanford.edu/~laurik/fsmbook/home.html Web scraping (Texte von HTML Seiten extrahieren)
BootCaT (Tool, um eigene Korpora basierend auf WEB-Inhalten zu erstellen)
XML Einführung (Tutorial w3schools)
Инструменты для немецкого языка
https://pub.cl.uzh.ch/wiki/public/kittWortsegmentierung an einem deutschen Text (interaktive Übung im CLab)
TreeTagger (Part-of-Speech-Tagger für verschiedene Sprachen)
Tokenisierung (CLab)
TreeTagger (Part-Of-Speech Tagger für verschiedene Sprachen)
TüBa (Baumbank aus syntaktisch-annotiertem Korpus)
Tiger Treebank (POS-Tagging und syntaktische Analyse)
STTS Tagset (Stuttgart-Tübingen-Tagset)
Porter Stemmer (Stemming zum Abtrennen morphologischer Flexionsendungen)
Durm Lemmatizer (Lemmatisierung von Substantiven)
CONNEXOR-Tagger (NLP - Natural Language Processing - Tagger)
GeoNames (Geographische Datenbank für Ortsnamen)
Wikidata (hilfreiche Datenbank für Named Entity Recognition)
TimeML (Markup Language für Zeitausdrücke)
Mate Tools (Toolkit für statistisches Natural Language Processing)
Conditional Random Fields (Tutorial CLab zum Taggen von sequenziellen Daten)
Universales Dependenzformat (multilinguale Baumbanken mit Annotationen)
CONNEXOR-Tagger (NLP - Natural Language Processing - Tagger)
TIGER-Treebank (POS-Tagging und syntaktische Analyse)
ParZu (The Zurich Dependency Parser for German)
WebAnno (und ein dazugehöriges YouTube
Tutorial)
EXMARaLDA (Annotation von digitalen Audio- und Videodaten)
Arborator (Annotation von syntaktischen Dependenzen)
RSTTool (Annotation der rhetorischen Textstruktur)
ANNIS Framework (Suche, Visualisierung und Export von annotierten Korpora)
Artigo (Annotation von kunsthistorischen Bildern)
TypeWright (Manuelles Validieren von OCR für englische Literatur)
Codeswitching (Wechsel zwischen zwei Sprachen)
EM-Algorithmus (Expectation Maximization)
lingua-ident (Spracherkennungs-Tool)
InterText (Alignment-Tool mit graphischer Benutzeroberfläche für Satzalignierung in parallelen Korpora)
HunAlign (Alignment-Tool für Satzalignierung in parallelen Korpora)
BleuAlign (Alignment-Tool für Wortalignierung in parallelen Korpora)
GIZA++ (Alignment-Tool für Wortalignierung in parallelen Korpora)
The Classical Language Toolkit
http://cltk.org/ Python
Learn to Program: The Fundamentals
https://www.coursera.org/learn/learn-to-program/home/welcomeNLTK
https://www.nltk.org/book/ch01.htmllangid.py (Python-Programm zur automatischen Spracherkennung von Texten)
Основы программирования на Python
https://www.coursera.org/learn/python-osnovy-programmirovaniya/home/welcomeИнтерактивный учебник языка Питон
http://pythontutor.ru/ XML
Основы XML для начинающих пользователей
https://www.ibm.com/developerworks/ru/library/x-newxml/index.htmlhttps://tei-c.org/https://msiter.ru/tutorials/uchebnik-xml-dlya-nachinayushchih/chto-takoe-xmlXML - Einführung (Extensible Markup Language Tutorial)
XML - Syntax (w3schools)
Zeichenkodierung (ASCII, Unicode, UTF-8, UTF-16, UTF-32)
TextGrid (TEI-XML Editor für digitales Editieren und Publizieren)
Визуализация
OpenLayers 3Leaflet (JavaScript Library)
Gephi (Visualisierungssoftware für Graphen und Netzwerke)
GraphViz (Graph Visualisierungssoftware)
D3.js (Visualisierung mit JavaScript)
P5.js (Visualisierung mit JavaScript)
Processing (Visualisierungssoftware)
Bubenhofer: Geokollokationen.
Nachtrag:
Vega, Lyra, Polestar und Voyager. (Vega ist eine abstrakte Beschreibungssprache für Visualisierungen, die dann automatisch in HTML 5, Canvas oder SVG realisiert werden)
Sprachtechnologie in den Digital Humanities
https://www.coursera.org/learn/digital-humanities/home/welcome