Text Engineering Software Laboratory

Text Engineering Software Laboratory
Tesla
Entwickler Universität zu Köln
Betriebssystem plattformunabhängig
Programmier­sprache Java
Kategorie Natural language processing
Lizenz Eclipse Public License
tesla.spinfo.uni-koeln.de

Tesla (Text Engineering Software Laboratory, deutsch Labor zur Verarbeitung von Texten) ist eine Software, mit der reproduzierbare Experimente auf textuellen Daten durchgeführt werden können. Als textuelle Daten gelten dabei alle Arten von Daten, die sich durch eine Sequenz diskreter Einheiten darstellen lassen.

Tesla wird seit 2005 am Institut für Linguistik der Universität zu Köln (Abteilung Sprachliche Informationsverarbeitung) entwickelt und stellt eine Software-Umgebung für Wissenschaftler, die mit Texten arbeiten, zur Verfügung.

Der konzeptuelle Schwerpunkt des Frameworks liegt dabei auf experimenteller Daten- und Verfahrensanalyse; so werden Wissenschaftler dabei unterstützt,

  • etablierte ebenso wie neu entwickelte Verfahren auf diesen Texten anzuwenden und
  • die Experimente in einer Form zu dokumentieren, mit der sie nachvollzogen und wiederholt werden können.

Tesla ist als Komponentensystem in Java implementiert, das auf Basis einer Client-Server-Architektur realisiert wurde. Über den Eclipse-basierten Client kann der Nutzer Texte verwalten und Experimente entwerfen. Experimente bestehen aus dem zu analysierenden Ausgangsmaterial (einzelne Texte oder Textsammlungen) und Komponenten, die bestimmte Aufgaben der Textprozessierung (bspw. Tokenisierung, Part-of-speech Tagging oder Sequenzalignment) übernehmen. Die Komponenten sind miteinander kombinierbar, wenn ihre Schnittstellen aufeinander abgestimmt sind. Schnittstellen der Komponenten sind die von ihnen erzeugten Ergebnisse, die als Annotationen mit den Rohdaten (Texte) verknüpft werden. Im Unterschied zu vergleichbaren Systemen wie UIMA sind die Ein- und Ausgabeschnittstellen von Tesla-Komponenten kaum restringiert, wodurch eine fein granulierte Komponenten-Kapselung ermöglicht wird, und es bspw. auch möglich ist, komplexe Datentypen (wie Graphen oder hochdimensionale Vektoren) als Annotationen zu verwenden.

Screenshot des Tesla-Clients mit geöffnetem graphischen Experiment-Editor

Literatur

  • Jürgen Hermes, Stephan Schwiebert: "Classification of text processing components: The Tesla Role System." In: Fink, Lausen, Seidel und Ultsch: "Advances in Data Analysis, Data Handling and Business Intelligence", Springer Verlag 2010 Abstract

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Software prototyping — Software prototyping, a possible activity during software development, is the creation of prototypes, i.e., incomplete versions of the software program being developed.A prototype typically simulates only a few aspects of the features of the… …   Wikipedia

  • Software bug — To report a MediaWiki error on Wikipedia, see Wikipedia:Bug reports. A software bug is the common term used to describe an error, flaw, mistake, failure, or fault in a computer program or system that produces an incorrect or unexpected result, or …   Wikipedia

  • Software agent — In computer science, a software agent is a piece of software that acts for a user or other program in a relationship of agency, which derives from the Latin agere (to do): an agreement to act on one s behalf. Such action on behalf of implies the… …   Wikipedia

  • List of software engineering topics — This list complements the software engineering article, giving more details and examples. For an alphabetical listing of topics, please see List of software engineering topics (alphabetical).Influence on societySoftware engineers affect society… …   Wikipedia

  • Outline of software engineering — See also: Index of software engineering articles The following outline is provided as an overview of and topical guide to software engineering: Software engineering – application of a systematic, disciplined, quantifiable approach to the… …   Wikipedia

  • College of Agricultural Engineering and Post Harvest Technology — (CAEPHT) Established 2006 Type Public Dean Dr. P. K. Srivastava Students Undergraduate and graduate Location …   Wikipedia

  • MBM Engineering College — Mugneeram Bangur Memorial Engineering College, is a technical college at Jai Narain Vyas University in Jodhpur, Rajasthan, India.HistoryOne of the best engineering colleges in India. Engineers produced by this institute are working allover the… …   Wikipedia

  • College of Technology & Engineering, Udaipur — The College of Technology and Engineering (CTAE) of Udaipur, Rajasthan, India, is a constituent college of the Maharana Pratap University of Agriculture and Technology. Contents 1 Overview: Maharana Pratap University of Agriculture and Technology …   Wikipedia

  • Watumull Institute of Electronic Engineering and Computer Technology — Infobox University name = Watumull Institute of Electronic Engineering and Computer Technology established = 1984 type = University of Mumbai (Bombay) city = Worli, Mumbai state = Maharashtra country = India undergrad = 1,200(approx) faculty =… …   Wikipedia

  • Decision engineering — framework Decision Engineering is a framework that unifies a number of best practices for organizational decision making. It is based on the recognition that, in many organizations, decision making could be improved if a more structured approach… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”