Was macht InfoCodex besser als die Konkurrenz? InfoCodex analysiert den Inhalt Ihrer Dokumente und legt dann eine einheitliche Sprache (Taxonomie) darüber. Mit InfoCodex können Sie sprachübergreifend suchen, d.h. 'War', Englisch = 'Krieg' wird von 'war', Deutsche Vergangenheit von 'ist' unterschieden. Ein weiteres Beispiel ist; 'die', Englisch = 'Sterben' und Deutsch = 'die' als Artikel (z.B. die Milch). So gibts 2.7 Mio Einträge in der linguistischen Datenbank von InfoCodex, welche eine sprachübergreifende Suche ermöglicht. Neben der sprachübergreifenden Suche ist auch die Synonym- und Ähnlichkeitssuche möglich (z.B. bei 'Führerausweis' wird auch nach 'Führerschein' gesucht).
Es geht darum, einerseits den Gesamtinhalt einer Kollektion und anderseits jedes einzelne Dokument _robotermässig_ zu analysieren und zu kategorisieren.
Inhaltsverzeichnis: 1.Worum geht es beim Wissensmanagement 2.Mehrwerte, die mit Wissensmanagement erzielbar sind 3.Evaluationsergebnis 4.Alleinstellungsmerkmale (USPs) von InfoCodex 5.Zugriffsschutz und Compliance 6.Weitere Stärken von InfoCodex 7.Referenzen 8.Bemerkungen zu den Werbetexten von Konkurrenzfirmen 9.FAQ InfoCodex 10.InfoCodexVorgehen
Daraus ergibt sich u.a.: Ein Wissensmanagement-Instrument muss den thematischen Inhalt von Dokumenten erkennen und die Dokumente entsprechend klassieren können (wenn möglich auch sprachübergreifend); mit einer reinen Suchmaschine sind die Probleme nicht gelöst.
"Etwa 85% aller Unternehmensdaten schwirren unstrukturiert ausserhalb von Datenbanken herum... .Etwa 1/3 ihrer Zeit verschwenden folglich Angestellte damit, relevante Informationen in der immer grösser werdenden Datenflut zu suchen" (zitiert von Nelson Mattos, IBM's Vice President of Information Integration, Aug. 2005).
In der umfassenden Evaluation von Wissensmanagement-Tools, welche durch die Agroscope - finanziert durch das Informatikstrategieorgan Bund (ISB) der schweizerischen Bundesverwaltung - durchgeführt wurde, haben InfoCodex und die Konkurrenz die Finalrunde erreicht (den Zuschlag hat schliesslich InfoCodex erhalten).
InfoCodex ist das einzige System, das über eine sprachübergreifende linguistische Datenbank verfügt, deren Einträge systematisch mit einem universellen Taxonomiebaum verknüpft sind. Das Verfahren zur Extraktion der Inhaltsschwergewichte und der Projektion auf einen optimalen Inhaltsraum zwecks Kategorisierung durch selbstorganisierende Neuronale Netze ist patentiert (CH, EU, USA). Patentinhaber ist die Swiss Re in einer speziellen Partnerschaft mit InfoCodex. Daraus ergeben sich:
Analyse und Kategorisierung der Dokumente ohne menschliche Intervention (d.h. InfoCodex ordnet die Dokumente selbständig in ein sachlogisch gegliedertes Büchergestell ein). Bei anderen Technologien (z.B. bei der Konkurrenz verwendeten "Pattern Recognition") braucht es in jedem neuen Vorhaben jeweils ein aufwändiges Trainieren der Kategorisierung.
Neben der üblichen exakten Suche (wie bei der bekannten Konkurrenz etc.) stehen auch die sprachübergreifende Synonymsuche (mit Fahrrad werden auch Velo, Drahtesel, push bike, bicyclette etc. gefunden) und die Ähnlichkeitssuche (finde Dokumente, die einem gegebenen Dokument möglichst ähnlich sind; Kernproblem in der Patentrecherche) zur Verfügung.
Einerseits vermittelt InfoCodex mit seiner Informations-Landkarte einen raschen Überblick über Inhalt und Struktur einer Dokumenten-Kollektion. Anderseits können beim Retrieval im Falle von grossen Trefferlisten die Dokumente in themenspezifische Clusters unterteilt werden (Heat-Map bzw. Clustering). Dies kann ein gezieltes Recherchieren entscheidend beschleunigen. Beispiel: Wenn man sich für Tiere interessiert und nach "Tiger" sucht, wird man den Bereich "Sport" besser weglassen.
Es gibt zwar spezielle Software für die Generierung von Abstracts. Bei den anderen Wissensmanagement-Tools steht unseres Wissens jedoch keine Abstract-Bildung zur Verfügung.
Erkennen von fast gleichen Dokumenten (z.B. leicht revidierte Versionen des gleichen Dokuments) und Zusammenfassung in Dokumentenfamilien. Dies ergibt einerseits kürzere Trefferlisten; andererseits ist dies ein Hilfsmittel bei Aufräumungsvorhaben.
Anbindung von InfoCodex an eine zentrale Benutzerverwaltung mit der LDAP-Schnittstelle; volle Respektierung der "File-System-Security"; dazu IC-Domänenkonzept für höchste Sicherheitsansprüche. Die Sicherheitsaspekte wurden bei der Agroscope-Evaluation einem harten Test unterzogen (hier weisen diverse Systeme grosse Schwachstellen auf).
Im Gegensatz zu anderen Systemen analysiert InfoCodex nicht nur den "E-Mail-Body", sondern auch die Attachments. Ausserdem zeigt InfoCodex beim Sichten die Original-Dokumente und deren Attachments an.
In der Praxis liegt ein grosser Teil der Information in den Attachments (und nicht im E-Mail-Text).
Die gebäuchlichen File-Formate (PDF, Word, PPT, HTML, XML, PS, RTF, Excel, E-Mails + Attachments, TXT, TIF, ZIP, GZIP etc.) werden standardmässig unterstützt.
Im Prinzip kann jeder Benutzer praktisch ohne Schulung eigene Kollektionen/Wissensgebiete anlegen. Routinemässig durchzuführende Recherchen können problemlos dem Job-Scheduler aufgegeben werden.
Erweiterungen durch Beizug von Synonymen aus der InfoCodex-Datenbank; leichtes Aufsetzen von periodisch wiederkehrenden Recherchen (siehe auch: InfoCodex-Flyer, Seite 4)
Ordnen von Dokumenten nach Ähnlichkeit mit einem Abfragetext aufgrund des fundierten Ähnlichkeitsmasses, welches sich aus der patentierten InfoCodex-Technologie ergibt.
In Standardfällen kann InfoCodex nach wenigen Stunden produktiv genutzt werden. Es sind keine organisatorischen Anpassungen nötig. InfoCodex passt sich an die bestehende Ordnung an und legt keine Kopien der Dokumente ab (es liest und analysiert die Dokumente und behält lediglich den Link zum Originaldokument). Bei der Konkurrenz kann die Einsatzvorbereitung mehrere Monate dauern.
InfoCodex ist bei mehreren erstklassigen Kunden installiert, z.B.
Beim Lesen von Produktbeschreibungen der Konkurrenz erhält man vielfach den Eindruck, dass eine weitgehende Mehrsprachigkeit abgedeckt ist (z.B. Unterstützung von 67 Sprachen oder sprachunabhängig). Unsere genaueren und aufwändigen Abklärungen haben immer wieder zum selben Ergebnis geführt: Unter Mehrsprachigkeit wird lediglich ein grobes Verfahren zur Abschätzung der Sprachzugehörigkeit verstanden. Eine echte sprachübergreifende Methode mit Sinnerkennung (Taxonomie) konnte bei keinem Konkurrenzprodukt gefunden werden.
====
Die Antwort ist JA.
PDF-Files werden durch verschiedene Software generiert (z.B. aus Word). Je nach erstellender Software bestehen Unterschiede im internen File-Aufbau. Dies führt dazu, dass die Konversion in TXT-Files nicht immer funktioniert (viele PDF-Files, die man im Internet sieht, werden beispielssweise durch die grossen Suchmaschinen nicht indexiert).
Das in InfoCodex realisierte Vorgehen sieht wie folgt aus:
_Ausnahme_: Wenn die OCR-Software Option aktiviert ist, wird das PDF-File durch den OCR-Interpreter geschickt und das Resultat wird mit pdftotext bzw. dem iFilter von Adobe konvertiert. Wir verwenden OmniPage als OCR-Interpreter, aber diese Komponente ist zurzeit noch nicht fest eingebaut (ist bei uns in der Testphase).
_Hinweis_: Viele PDF-Files sind reine Photokopien und müssen zwecks Indexierung durch den OCR-Interpreter geschickt werden.
Nein! InfoCodex verfolgt die User-Pro-Jahr-Fee Philosophie. Sie erhalten eine CD mit der Software. Die Anzahl User, welche mit der Software erstellt werden können, ist in die Software reinkompilliert. Sie können mit InfoCodex also beliebig viele Dokumente indexieren, soviele wie Sie CPU-Power zur Verfügung stellen wollen. Sie können InfoCodex also auch auf mehreren Server installieren.