Wiktionary

Wiktionary
Wiktionary
Das Logo von Wiktionary
Motto ein Wiki-basiertes freies Wörterbuch
Kommerziell Nein
Beschreibung Wikiprojekt zur Erstellung eines freien Wörterbuches sowie Thesaurus in jeder Sprache
Registrierung optional
Sprachen 172, darunter Deutsch, Französisch und Englisch
Eigentümer Wikimedia Foundation
Urheber einzelne angemeldete und nicht angemeldete Autoren
Erschienen Englische Version: 12. Dez. 2002

Deutsche Version: 001. Mai 2004

Das Wiktionary [ˈvɪkʃənərɪ] (Wikiwörterbuch) ist ein gemeinschaftliches Projekt der Wikimedia zur Erstellung eines frei zugänglichen, vollständigen und mehrsprachigen Wörterbuches sowie eines entsprechenden Thesaurus in jeder Sprache. Der Name Wiktionary ist ein analog zu Wikipedia gebildetes Kofferwort, das sich aus den Wörtern Wiki (hawaiisch für „schnell“)[1] und dictionary (englisch für „Wörterbuch“) zusammensetzt. Seit der Gründung 2002 wuchs die Anzahl der Einträge in die Wiktionarys international auf über 11,5 Millionen an.[2]

Inhaltsverzeichnis

Konzept und Projekt

Sprachübergreifende Einstiegsseite des Wiktionary

Wiktionary ist der lexikalische (lexikografische) Partner der freien Online-Enzyklopädie Wikipedia. Analog zu den verschiedenen Sprachausgaben der Wikipedia gibt es Wiktionarys in unterschiedlichen Sprachen. Während die Wikipedia als ein Lexikon Sachinformationen zu den Begriffen zur Verfügung stellt, übernimmt das Wiktionary die Funktionen eines Sprachwörterbuchs und eines Thesaurus; es dient somit der Vermittlung sprachlichen Wissens. In der Funktion als Sprachwörterbuch soll es sprachliche Eigenschaften wie Homonyme, Bedeutung, Grammatik, Etymologie und Übersetzungen erklären; die Auswahl der Lemmata soll den Wortschatz der Sprachen abdecken. In der Funktion als (linguistischer) Thesaurus werden zum Worteintrag assoziierte Begriffe wie Synonyme und Oberbegriffe zusammengestellt. Wie die Wikipedias werden die Wiktionarys laufend erweitert und verbessert; jeder kann jederzeit mitarbeiten.

Im Gegensatz zu üblichen gedruckten meist zweisprachigen Sprachwörterbüchern ist das Konzept der Wiktionarys so offen angelegt, dass in jeder einzelnen Sprachversion Lemmata zu Einträgen in allen Sprachen erwünscht sind. In einer theoretischen Endausbaustufe besäße jedes Sprach-Wiktionary den Wortschatz aller Fremdsprachen, erklärt in der Grundsprache des jeweiligen Wiktionarys, sowie zusätzlich alle Einträge aus dem Wortschatz der eigenen Sprache inklusive Übersetzungen in alle Fremdsprachen.

Einer Aussage beim Wikimedia-Projekt Meta zufolge wurde die Idee zur Erstellung des Wiktionary erstmals im Jahr 2002 von Daniel Alston (mit dem Benutzernamen Fonzy) vorgebracht.[3]

Die englische Version wurde als erstes Wiktionary am 12. Dezember 2002 begonnen. Die deutsche Version, das Wikiwörterbuch, startete am 1. Mai 2004. Der 100.000ste Eintrag dieses Projektes wurde am 31. Dezember 2009 erstellt.[4]

In den Wiktionarys werden für unterschiedliche Groß-/Kleinschreibung mit gleicher Buchstabenfolge einzelne Einträge generiert (Beispiel: Bank und bank im deutschen Wikiwörterbuch); dieses Vorgehen weicht von dem der Wikipedias ab, die unterschiedliche Groß-/Kleinschreibungsvarianten in einem Eintrag bündeln. Die Möglichkeit, verschiedene Einträge für Groß- und Kleinschreibungsvarianten zu generieren, wurde nach Aussagen des Wikimedia-Projekts Meta erst 2006 geschaffen.[5] Von dieser Option macht heute eine Vielzahl der Sprachversionen Gebrauch, bei einigen Sprachversionen ist dies jedoch nicht der Fall.

Alle Einträge in den Wiktionarys erhalten eine feste Formatvorlage. Das deutsche Wikiwörterbuch kategorisiert Artikel nicht nach der Bedeutung der erklärten Begriffe (es gibt also beispielsweise keine Kategorien „Biologie“ oder „Medizin“), sondern hauptsächlich nach ihrer Zugehörigkeit zu einer Wortart und einer Sprache. Um dennoch eine gewisse Übersicht über die Abdeckung bestimmter Fachgebiete aus dem Artikelbestand zu bieten, werden manuell gepflegte Listen geführt.[6]

In Wiktionarys können Audiodateien zur Demonstration der Aussprache eingebunden werden. Das deutsche Wikiwörterbuch weist über 18.000 mit Audiodateien versehene Einträge auf.[7] Darüber hinaus wird das Wikiwörterbuch – per gezieltem Einsatz nur bei hierfür geeigneten Einträgen – zum Bildwörterbuch ausgebaut; zum Stand August 2011 sind über 11.300 Illustrationen eingebunden.[8]

Lizenz

Die Inhalte der Wiktionarys sind lizenziert unter der GNU-Lizenz für freie Dokumentation (GFDL) und seit Juni 2009 zusätzlich unter der Creative-Commons-Lizenz „CC-BY-SA 3.0 Unported“. Für die Umstellung auf die Doppellizenz musste erst die GFDL von der Version 1.2 auf eine neue Version 1.3 aktualisiert werden, was aufgrund der Struktur der Version 1.2 ohne Einwilligung der Autorenschaft möglich war. Näheres zur Umstellung auf die Doppellizenz siehe GNU-Lizenz für freie Dokumentation#Verwendung in der Wikipedia.

Übersicht

Nachdem das englischsprachige Wiktionary am 12. Dezember 2002 gestartet wurde, folgten am 29. März 2004 die französisch- und die polnischsprachige Version. Wiktionary wurde zunächst auf einer provisorischen URL wiktionary.wikipedia.org betrieben, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde. Zu diesem Termin wurde zu jeder weiteren Sprache, in der bereits eine Wikipedia-Version betrieben wurde, ein Wiktionary gestartet. So entstanden an einem Tag 143 weitere Wiktionarys, darunter war die deutschsprachige Version.[2]

Bis heute sind in allen 170 Sprachversionen zusammen über 11,5 Millionen Einträge verfügbar. Die meisten Einträge, rund 2,58 Millionen, stellt dabei die englischsprachige Version bereit, gefolgt von der französischsprachigen mit rund 2,05 Millionen Einträgen. Diese beiden größten Wiktionarys haben ihre Plätze in der Rangfolge nach Zahl der Einträge mehrmals getauscht; erstmals Anfang 2006 war die französischsprachige Version die mit den meisten Einträgen. Ab Mitte 2010 ist jedoch wieder die englischsprachige Version die mit den meisten Artikeln. Aktuell stellen die 24 größten Wiktionarys jeweils mehr als 100.000 Einträge bereit. Das deutschsprachige Wiktionary steht mit über 185.000 Einträgen auf Rang 12.[2]

Hier eine Tabelle mit den Eintragsanzahlen der 20 größten Wiktionarys zum Stand vom 20. August 2011:[9]

Nr Sprachkürzel Sprache Anzahl Einträge
1 en Englisch 2.579.184
2 fr Französisch 2.050.541
3 zh Chinesisch 1.183.437
4 mg Malagasy 596.672
5 lt Litauisch 560.490
6 ru Russisch 296.757
7 tr Türkisch 278.059
8 pl Polnisch 235.647
9 vi Vietnamnesisch 229.123
10 ta Tamilisch 226.365
Nr Sprachkürzel Sprache Anzahl Einträge
11 ko Koreanisch 203.002
12 de Deutsch 185.747
13 io Ido 184.122
14 hu Ungarisch 175.084
15 pt Portugiesisch 174.914
16 fi Finnisch 174.542
17 el Griechisch 171.571
18 sv Schwedisch 138.556
19 no Norwegisch (Bokmål) 126.305
20 nl Niederländisch 121.727

Es gibt detaillierte Statistikseiten für die Wiktionarys, die auch die historische Entwicklung abbilden.[10] Die Anzahl an Einträgen für sich sagt nur wenig über die Qualität einer Sprachversion des Wiktionary; siehe hierzu auch das Kapitel über Wachstumsschübe durch Bots. Statistiken, die die Einträge nach Qualitätsmerkmalen klassifizieren, sind bislang nur eingeschränkt verfügbar.[11]

Einzelne Sprachversionen des Wiktionary

Wachstumskurve des deutschsprachigen Wiktionarys
Logo des Wikiwörterbuchs oder deutschsprachigen Wiktionarys

Deutsch

Das deutschsprachige Wiktionary oder Wikiwörterbuch wurde am 1. Mai 2004 gestartet. Für die Außendarstellung des deutschsprachigen Wiktionarys existieren bis heute die beiden Begriffe „Wiktionary“ und „Wikiwörterbuch“ nebeneinander. Im Logo (die nebenstehende Abbildung zeigt das Logo vor weißem statt grau meliertem Hintergrund) lautet die Abfolge der Textpassagen „Wikiwörterbuch – Wiktionary – [ˈvɪkʃəˌnɛʀi], n – Das freie Wörterbuch – ein Wiki-basiertes freies Wörterbuch“, wobei die oberste und unterste Passage „Wikiwörterbuch“ und „ein Wiki-basiertes freies Wörterbuch“ in grauer Schrift auf heller grauem Untergrund gesetzt sind.

Von den gut 185.000 Einträgen zum Stand vom 20. August 2011 waren in der Aufteilung nach Sprache der erklärten Wörter etwa 88.000 Einträge deutsch, rund 39.000 Einträge englisch, etwa 16.000 Einträge italienisch und zirka 7.600 Einträge französisch; die restlichen Einträge verteilten sich auf 202 weitere Sprachen.[12] Laut Angaben von wikistics.falsikon.de war unter den eigentlichen Wörterbucheinträgen im August 2009 am häufigsten auf die Einträge „subtil“, „obligatorisch“ und „pragmatisch“ zugegriffen worden.[13]

Englisch

Als allererste Sprachversion wurde das englischsprachige Wiktionary am 12. Dezember 2002 gestartet. Brion Vibber legte das Wiktionary zunächst auf einer provisorischen URL wiktionary.wikipedia.org an, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde.[14] Im November 2005 wurden 100.000 Einträge erreicht, im August 2007 wurden es 500.000. Die Schwelle von 1 Million Einträgen wurde am 18. Oktober 2008 überschritten. Am 27. November 2009 waren es 1,5 Millionen Einträge, und den 2-millionsten Eintrag gab es am 7. September 2010.[15]

Unter den am 20. August 2011 vorhandenen etwa 2,6 Millionen Einträgen waren aufgeteilt nach Sprache der erklärten Wörter etwa 479.000 Einträge Latein, 446.000 italienisch, 371.000 englisch, 230.000 spanisch, 188.000 französisch und 102.000 finnisch; der Rest verteilte sich auf weit über 400 weitere Sprachen.[16]

Französisch

Am 29. März 2004 wurde das französischsprachiges Wiktionary oder Wiktionnaire ins Leben gerufen. Mittlerweile weist es über 2,05 Millionen Einträge auf und ist damit nach der englischen Version auf Platz 2 der umfangreichsten Sprachversionen des Wiktionary. Von den am 20. August 2011 vorhandenen 2,05 Millionen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 1.111.000 Einträge französisch, jeweils 155.000 russisch und bulgarisch, 117.000 englisch und 80.000 slovenisch; der Rest verteilte sich auf über 900 weitere Sprachen.[17]

Vietnamesisch

Das Wiktionary in vietnamesischer Sprache wurde 2004 gestartet. Von den mittlerweile über 230.000 vorhandenen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 110.000 englisch, 44.000 französisch, 35.000 russisch und 31.000 vietnamesisch; der Rest verteilte sich auf 54 weitere Sprachen.[18]

Polnisch

Das polnischsprachige Wiktionary wurde im März 2004 ins Leben gerufen. Von den am 20. August 2011 vorhandenen etwa 236.000 Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 35.000 Einträge englisch, 30.000 polnisch, 21.000 chinesisch und 19.400 in der Plansprache Interlingua; der Rest verteilte sich auf 264 weitere Sprachen.[19] Die zirka 7.900 Einträge in jiddisch machen das polnische Wiktionary nach eigener Darstellung[20] zum größten modernen Wörterbuch der Nachkriegszeit für Jiddisch, das in Polen ‚herausgegeben‘ wurde. Knapp 6.000 dieser Einträge entstanden 2007 durch eine Bot-Aktion (siehe das Kapitel über Wachstumsschübe durch Bots).

Wachstumskurve der 8 größten Sprachversionen des Wiktionary bis März 2008. Die Wachstumssprünge durch den Einsatz von Bots sind deutlich erkennbar.

Wachstumsschübe durch Bots

Die meisten Einträge in den umfangreichsten Sprachversionen des Wiktionary sind durch den Einsatz von Bots entstanden. Ihre Programmierer fanden kreative Wege, um große Zahlen neuer Einträge zu generieren oder tausende von Einträgen aus öffentlich zugänglichen Wörterbüchern maschinell zu importieren.

Sieben der mittlerweile über 30 Bots, die beim englischsprachigen Wiktionary als solche gelistet sind,[21] haben dort etwa 163.000 Einträge neu erstellt.[22] 259 Komplex-Einträge, die selbst viele Definitionen enthalten, wurden von Websterbot aus öffentlich verfügbaren Quellen importiert; die meisten dieser Importe sind manuell in Tausende Einträge gesplittet worden. Ein weiterer dieser Bots, ThirdPersBot, erstellte Verbnebenformen in der dritten Person Singular, die in gedruckten Wörterbüchern üblicherweise nicht einzeln aufgeführt werden. Zur Zeit dieser Aktionen im Jahr 2006 hatte das englischsprachige Wiktionary ohne die etwa 163.000 Bot-Einträge etwa 137.000 Einträge und war damit noch deutlich kleiner als viele gedruckte Wörterbücher: So umfasst das Oxford English Dictionary etwa 615.000 Worteinträge und das Merriam-Webster's Third New International Dictionary of the English Language, Unabridged 475.000 Einträge; dabei sind viele Wortwendungen nur im Textkörper anderer Einträge vorhanden.

Die Wiktionarys in englischer und französischer Sprache haben die zirka 20.000 Einträge der Unihan-Datenbank der CJK-Schriftzeichen (chinesisch, japanisch und koreanisch) importiert.

Auch das rapide Wachstum des französischsprachigen Wiktionarys im Jahr 2006 geht hauptsächlich auf die Arbeit von Bots zurück, die viele Einträge aus alten, lizenzfreien Wörterbüchern wie der 8. Ausgabe des Dictionnaire de l'Académie française von 1935 mit rund 35.000 Worteinträgen übernahmen, sowie von Bots, die Begriffe aus anderen Sprachausgaben des Wiktionary mit französischen Übersetzungen importierten. Das französisch- wie das vietnamesischsprachige Wiktionary haben große Teile des Free Vietnamese Dictionary Project (FVDP)[23] importiert. Dieses bietet frei zugängliche zweisprachige Wörterbücher von und ins Vietnamesische an.[24] Das vietnamesischsprachige Wiktionary bestand nach dieser Aktion fast ausschließlich aus diesen importierten Einträgen.

Das Wiktionary in polnischer Sprache hat mit Hilfe des Bots Tsca.bot[25] im Zeitraum vom 10. Juli bis zum 27. November 2004 zirka 15.000 Stummeleinträge der Plansprache Interlingua mit Genehmigung des Autors von der Webpräsenz interlingua.filo.pl importiert.[26] Mit Hilfe desselben Bots Tsca.bot wurden vom 31. März bis zum 2. April 2007 knapp 6.000 Einträge in jiddischer Sprache angelegt, die zumeist neben der polnischen Übersetzung die IPA-Aussprache und die YIVO-Transkription enthielten.[27]

Das russischsprachige Wiktionary übernahm mit Hilfe des Bots LXbot ab Oktober 2006 etwa 80.000 Stummeleinträge („Boilerplates“) für englische, deutsche und französische Wörter.[28][29][30] Ab Juni 2008 wurden durch den Bot TrudoBot in hoher Zahl Stummeleinträge für russische Wörter erstellt.[31]

Bedeutung

Sprachübergreifend gesehen wird wiktionary.org von Alexa Internet im sogenannten „Alexa Traffic Rank“ auf Rang 755 (Stand 20. August 2011) geführt.[32] Von den registrierten Zugriffen erfolgten nach Sprachversion etwa 44 % auf die englische, 12 % auf die französische und 10 % auf die deutsche Version; der Rest verteilte sich auf die vielen weiteren Sprachversionen.

Literatur

  • Kai-Uwe Carstensen, Christian Ebert, Susanne Jekat, Cornelia Ebert, Hagen Langer, Ralf Klabunde (Hrsg.): Computerlinguistik und Sprachtechnologie. Eine Einführung. 3. Auflage 2010 Auflage. Spektrum Akademischer Verlag, Heidelberg, ISBN 978-3-8274-2023-7 (insbesondere S. 548–550).
  • A. Elia: Can a collaborative Wiki Weblish Dictionary Project help academic writing of ICT language learners?. In: Isabel González-Pueyo, Carmen Foz Gil, Mercedes Jaime Siso, Marco Luzón, María José (Hrsg.): Teaching Academic and Professional English Online. Peter Lang Publishing Group, 2009, ISBN 978-3-03911-582-2.

Einzelnachweise

  1. wiki in Hawaiian Dictionaries
  2. a b c Wiktionary, Eintrag beim Wikimedia-Projekt Meta, abgerufen zuletzt am 20. August 2011.
  3. Talk:Wiktionary/Archives/2002 beim Wikimedia-Projekt Meta; dies bezieht sich wiederum auf den Eintrag Wiktionary/Split_into_thesaurus_and_dictionary beim gleichen Projekt.
  4. Wiktionary:Meilensteine im deutschen Wikiwörterbuch.
  5. Capitalization of Wiktionary pages beim Wikimedia-Projekt Meta, abgerufen am 13. September 2009.
  6. Verzeichnis:Übersicht im Wikiwörterbuch.
  7. Kategorie:Audio-Datei im Wikiwörterbuch, abgerufen am 20. August 2011.
  8. Kategorie:Illustration im Wikiwörterbuch, abgerufen am 20. August 2011.
  9. s23.org/wikistats/wiktionaries_html.php, abgerufen am 20. August 2011.
  10. Siehe Wiktionary:Statistik/Sprachenübersicht in der deutsch- und Wiktionary:Statistics#Detail in der englischsprachigen Ausgabe des Wiktionary.
  11. Siehe etwa Wiktionary Category Overview bei stats.wikimedia.org.
  12. Wiktionary:Statistik/Sprachenübersicht, abgerufen am 20. August 2011.
  13. Page hits per day for de.wiktionary in month 2009-08, Statistik bei wikistics.falsikon.de.
  14. Talk:Wiktionary/Archives/2002 bei meta.wikimedia.org, abgerufen am 13. September 2009.
  15. Wiktionary:Milestones beim englischsprachigen Wiktionary, abgerufen am 13. Dezember 2009.
  16. Wiktionary:Statistics, abgerufen am 20. August 2011 (Version vom 19. August 2011).
  17. Wiktionnaire:Statistiques, abgerufen am 20. August 2011 (Version mit Stand vom 28. Juli 2011).
  18. Wiktionary:Thống kê im vietnamesischsprachigen Wiktionary, abgerufen am 15. September 2009.
  19. Wikisłownik:Statystyka im polnischsprachigen Wiktionary, abgerufen am 20. August 2011 (Version mit Stand vom 16. August 2011).
  20. Portal:Jidysz/pl/mainpage im polnischsprachigen Wiktionary, abgerufen am 17. September 2009.
  21. Siehe Special:Listusers beim englischsprachigen Wiktionary.
  22. Aussage auf Wiktionary in der englischsprachigen Version, abgerufen am 2. September 2009; angegeben werden folgende Bearbeitungszähler für 5 Bots: TheDaveBot, TheCheatBot, Websterbot, PastBot, NanshuBot. Allerdings ist hier zu beachten, dass nicht jeder Edit eine Neuanlage eines Eintrags darstellt.
  23. Free Vietnamese Dictionary Project (FVDP) bei der Universität Leipzig.
  24. Für Details siehe auch Wiktionary:Nguồn gốc/FVDP beim vietnamesischen Wiktionary.
  25. Siehe Tsca.bot im polnischsprachigen Wiktionary.
  26. Eintrag des ersten Wortes (abandonamento) und Eintrag des letzten Wortes (tic-tac) durch Tsca.bot aus der Quelle http://interlingua.filo.pl.
  27. Eintrag des ersten Wortes (שפּאַס) und Eintrag des letzten Wortes (שראַם) durch Tsca.bot.
  28. triskaidekaphobia, erster Eintrag dieser Art durch LXbot.
  29. Bearbeitungszähler für LXbot.
  30. Siehe Diskussionsabschnitt ru:User:LXbot bei User talk:VPliousnine im englischsprachigen Wiktionary.
  31. Участник:TrudoBot im russischsprachigen Wiktionary.
  32. wiktionary.org bei Alexa, abgerufen am 20. August 2011.

Weblinks

 Commons: Wiktionary-Statistiken – Sammlung von Bildern, Videos und Audiodateien
 Commons: Wiktionary-Logos – Album mit Bildern und/oder Videos und Audiodateien
Wiktionary Wiktionary: Wiktionary – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Wiktionary Wiktionary auf deutsch – ein freies Wörterbuch.


Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Wiktionary — noun /ˈwɪkʃən(ə)ri,ˈwɪkʃəˌnɛɹi,ˈwɪkʃəˌnɛri/ A collaborative project run by the to produce a free and complete dictionary (lexicon and thesaurus therein) in every language …   Wiktionary

  • Wiktionary — Infobox Website name = Wiktionary caption = Screenshot of wiktionary.org home page url = http://www.wiktionary.org/ commercial = No type = Online dictionary language = Multi lingual (over 150) registration = Optional owner = Wikimedia Foundation… …   Wikipedia

  • Wiktionary — Wiktionnaire Logo de Wiktionnaire URL http://fr.wiktionary.org …   Wikipédia en Français

  • Wiktionary — Викисловарь Wiktionary http://wiktionary.org/ Коммерческий: Нет Тип сайта: Сетевая энциклопедия Регистрац …   Википедия

  • Ultimate Wiktionary — OmegaWiki OmegaWiki (anciennement WiktionaryZ (WZ), anciennement Ultimate Wiktionary (UW)) est un dictionnaire multilingue de traduction fondé sur le principe de base de données relationnelle. Sommaire 1 Historique 2 Dates importantes du… …   Wikipédia en Français

  • bacitracin — noun A nonprescription antibiotic, usually provided in topical ointment form and discovered as a product of the bacterium Bacillus subtilis. <!From the discussion page for John Kerry in Wikipedia: , Ive seen it both ways but lower case is more …   Wiktionary

  • Nadir — noun a) A male given name. <!Wiktionary does not give these: b) A family name See Also: Nadia …   Wiktionary

  • second-level domain — noun a) a domain that is immediately below a top level domain Wiktionary.org is a second level domain b) a domain name that contains a single period …   Wiktionary

  • translating dictionary — noun A dictionary whose purpose is translating from language to language, as opposed to defining words in a single language. Wiktionary is meant to be both a defining dictionary and a translating dictionary …   Wiktionary

  • virtually — adverb /ˈvɚ.tʃwə.li/ a) almost but not quite. Wiktionary will never even be virtually complete. b) Without exaggeration; literally virtually indicable …   Wiktionary

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”