PortalDerWirtschaft.de



Suchmaschinenoptimierung mit PdW
mit Content-Marketing - Ihre News
English

SAS Deutschland und die Biocomputing Unit des European Molecular Biology Laboratory (EMBL) entwickeln Text Mining-Anwendung für die Auswertung wissenschaftlicher Publikationen


Von SAS Institute GmbH

Automatisierte Auswertung und Klassifizierung von täglich 2.000 Dokumenten – schnelleres Update wissenschaftlicher Datenbanken
Thumb SAS Deutschland entwickelt gemeinsam mit dem European Molecular Biology Laboratory (EMBL) eine Text Mining-Anwendung für die automatisierte Zuordnung und Klassifizierung von wissenschaftlichen Dokumenten. Sie basiert auf dem SAS Text Miner, mit dem sich unstrukturierte Textdokumente effizient auswerten lassen. Die Biocomputing Unit des EMBL plant, die Anwendung für die Erweiterung seiner Datenbanken im Bereich Bioinformatik einzusetzen. Diese Datenbanken dienen Forschern weltweit für die Evaluierung und die Vorhersage von Funktionen molekularbiologischer Bausteine in Proteinen. Mithilfe der Anwendung wird die Ad-hoc-Recherche wissenschaftlicher Publikationen durch einen strukturierten, automatisierten Prozess ersetzt. Damit lässt sich die Recherchezeit erheblich reduzieren und gleichzeitig die Qualität der Suchergebnisse steigern. Die Anwendung identifiziert Dokumente, die inhaltlich verwandt sind und erstellt Suchprofile, die den Gemeinsamkeiten dieser Dokumente entsprechen. Die Anwender können dadurch Publikationen mit diesen Suchprofilen abfragen, ohne auf komplexe Queries – Abfragen – zurückgreifen zu müssen. Zudem werden auf Wunsch automatisch wöchentliche und tägliche Updates zu den relevanten Neuerscheinungen und Forschungsthemen versendet. Das von 15 europäischen Ländern und Israel getragene EMBL betreibt Grundlagenforschung im Bereich Molekularbiologie und stellt Wissenschaftlern der Mitgliedstaaten und weltweit umfangreiche Serviceleistungen zur Verfügung. Im Rahmen des ELM (Eukaryotic Linear Motif Resource, http://elm.eu.org/) ist es Aufgabe der Biocomputing Unit, thematisch geordnete Datenbanken zur Vorhersage von Funktionen in Proteinen einzurichten. Hierfür werden Informationen in PubMed, ein Service der National Library of Medicine (http://www.ncbi.nlm.nih.gov/), ausgewertet und klassifiziert. In der weltweit umfangreichsten bibliografischen Datenbank für Life Sciences-Fachliteratur sind die Autoren, Titel und Abstracts von mehr als 4.600 biomedizinischen Zeitschriften aus 70 Ländern hinterlegt – insgesamt mehr als 12 Millionen Beiträge. Die Sammlung wächst pro Tag um 2.000 neue Dokumente. Herausragendes Merkmal der Text Mining-Anwendung: Sie beschränkt sich nicht wie eine Suchmaschine auf vordefinierte Wortschätze, sondern testet alle möglichen Kombinationen von informationstechnischen Auflösungen der Textbausteine. Dann wählt sie aus der Vielzahl von Statistik- und Data Mining-Modellierungen ein optimales Modell für jedes Profil aus. „Das EMBL steht vor dem gleichen Problem wie viele andere Institutionen und Unternehmen: Sie müssen aus großen Mengen an unstrukturiertem Text möglichst effizient Wissen gewinnen“, erklärt Ulrich Reincke, Manager Business Competence Center Data Mining bei SAS Deutschland. „Der SAS Text Miner automatisiert diesen Prozess und verschafft den Anwendern so schnell und komfortabel Zugang zu Informationen, die sie sonst nur mit erheblichem Aufwand oder sogar gar nicht hätten gewinnen können.“ „Gemeinsam mit SAS entwickeln wir eine Anwendung, die die Arbeit unserer Datenbank-Entwickler erheblich vereinfacht“, so Toby Gibson, Team Leader der Biocomputing Unit beim EBML. „Wissenschaftler können nur dann erfolgreich arbeiten, wenn sie jederzeit den aktuellen Stand der Forschung abrufen können. Mit der neuen Text Mining-Lösung wird es möglich sein, pro Tag 2.000 neue Dokumente in die Datenbanken aufzunehmen. Die vollständige Automatisierung macht die Recherche von Informationen außerdem deutlich komfortabler.“ circa 3.100 Zeichen Diesen Text können Sie von http://www.haffapartner.de oder http://www.sas.de herunterladen. Über SAS Text Miner Der SAS Text Miner entschlüsselt die semantische Struktur von Dokumenten, um die relevanten Informationen zu identifizieren. Dabei werden Texte nach verschiedenen Vorverarbeitungsschritten (wie etwa die Reduktion von Synonymen oder Wortstämmen) mithilfe einer Singulärwertzerlegung in synthetische Bausteine überführt, deren Häufigkeiten sich für jedes Dokument als numerische Variablen darstellen lassen. In einem nächsten Schritt werden hierauf dann Data-Mining-Verfahren angewandt, um die optimalen Suchprofile zu erstellen. Text Mining lässt sich überall dort sinnvoll einsetzen, wo aus großen Textmengen Informationen extrahiert werden sollen. Damit profitiert eine äußerst vielschichtige Anwendergruppe von diesem Verfahren – etwa Wissenschaftler, Marketing- und CRM-Spezialisten, Produktmanager, Help-Desk-Mitarbeiter, Juristen, Journalisten oder Mitarbeiter in der Personalabteilung. Über EMBL The European Molecular Biology Laboratory (EMBL) was established in 1974 and is supported by sixteen countries including most EU Member States, as well as Switzerland and Israel. EMBL consists of five units: the main Laboratory in Heidelberg (Germany), Outstations in Hamburg (Germany), Grenoble (France), Hinxton (the U.K.) and Monterotondo (Italy). EMBL was founded with a four-fold mission: to conduct basic research in molecular biology, to provide essential services to scientists in its Member States, to provide high-level training to its staff, students, and visitors, and to develop new instrumentation for biological research. Over its 25-year history, the Laboratory has had a deep impact on European science in all of these areas. EMBL has achieved so much because it is a truly international, European institution, because it has achieved a critical mass of services and facilities which are driven by cutting-edge biological research, and because it regards education -- at all levels -- as a way of life. The scientific networks created by EMBL alumni have contributed heavily to the development of this truly international scientific community throughout Europe. The Laboratory has a number of unique features. Its Outstations provide European biologists access to large instruments for the study of protein structures, some of the world's oldest and biggest databases of DNA and protein sequences, and a host of services operated by highly-trained biologists who are simultaneously involved in their own research. The Outstations are optimally located on campuses which foster links to a much larger network of European science -- neighbors including the Sanger Centre and the Welcome Trust, DESY, the ESRF and the ILL, EMMA, and a host of academic and industrial partners. The laboratory also sponsors an active Science & Society Programme which aims to promote communication between its scientific community and the public by means of lecture series and conferences on a variety of topics. Über SAS Gegründet im Jahr 1976, ist SAS heute der weltweit führende Anbieter von Business-Intelligence-Lösungen und -Services, die Unternehmen befähigen, aus Geschäftsdaten wertvolles Wissen für strategische Entscheidungen zu gewinnen. Die SAS Lösungen helfen Unternehmen, die Beziehungen zu ihren Kunden und Lieferanten sowie die internen Geschäftsprozesse zu optimieren. Weltweit arbeiten mehr als 40.000 Unternehmen und Organisationen mit Software von SAS - darunter 90 Prozent der globalen Fortune 500-Unternehmen. Als einziger Business-Intelligence-Anbieter integriert SAS modernste Data-Warehousing-Technologien, komplexe analytische Verfahren und BI-Anwendungen. Firmensitz der US-amerikanischen Muttergesellschaft ist Cary, North Carolina (USA). SAS Deutschland hat seinen Sitz in Heidelberg. Weitere Informationen unter http://www.sas.de Weitere Informationen: SAS Institute GmbH In der Neckarhelle 162 D-69118 Heidelberg Fon +49 (0)62 21 / 415-0 Fax +49 (0)62 21 / 415-140 http://www.sas.de Petra Moggioli Fon +49 (0)62 21 / 415-12 15 Petra.Moggioli@ger.sas.com EMBL Meyerhofstraße 1 Meyerhofstr. 1 D-69117 Heidelberg Fon +49 (0)6221 / 387 252 Fax +49 (0)6221 / 387 525 http://www.embl.de Russ Hodge EMBL Office of Information and Public Affairs hodge@embl.de Agenturkontakt: Dr. Haffa & Partner Public Relations GmbH Burgauerstraße 117 D-81929 München Fon +49 (0)89 / 99 31 91-0 Fax +49 (0)89 / 99 31 91-99 http://www.haffapartner.de Barbara Wankerl Fon +49 (0)89 / 99 31 91-40 sas@haffapartner.de Sebastian Pauls Fon +49 (0)89 / 99 31 91-46 sas@haffapartner.de


Kommentare

Bewerten Sie diesen Artikel
Bewertung dieser Pressemitteilung 5 Bewertung dieser Pressemitteilung 2 Bewertungen bisher (Durchschnitt: 5)
Hinweis Für den Inhalt der Pressemitteilung ist der Einsteller, Barbara Wankerl, Sebastian Pauls, verantwortlich.

Pressemitteilungstext: 1034 Wörter, 8336 Zeichen. Artikel reklamieren
Keywords
Diese Pressemitteilung wurde erstellt, um bei Google besser gefunden zu werden.

Tragen Sie jetzt Ihre kostenlose Pressemitteilung ein!