Jährlich werden mehr als 2.5 Trillionen PDF-Dateien generiert. Allein bei Google Drive werden täglich rund 70 Millionen Dateien hochgeladen. 80 Prozent der relevanten Unternehmensdaten sind unstrukturiert - in Form von Büchern, PDFs oder Word-Dateien - vorhanden und somit ungeeignet für weitere Analysen oder die Integration in Web- und Mobile-Apps. Nur 20 Prozent der Daten sind bereits in Excel-, HTML-, XML-, JSON-Dateien zugänglich.
Deshalb sitzen rund um den Globus Menschen in ihren Büros und verwenden viel Zeit darauf, Daten aus Dokumenten in die firmeninternen Systeme zu «copy-and-pasten». Doch das muss nicht sein, sagten sich die vier Turicode-Gründer Aaron Richiger, Benjamin von Deschwanden, Patrick Emmisberger und Martin Keller.
Die Innovation von Turicode basiert auf zwei selbst entwickelten, weltweit einzigartigen Technologien für die automatisierte Datenextraktion. Mit der Document Query Language (DQL), können – um ein Beispiel zu nennen – alle IBAN-Nummern in einem PDF abgefragt werden. Und mit dem Machine Learning Based Classifier lassen sich ähnliche Elemente in einem Dokument identifizieren; zum Beispiel alle Preise in einem Produktkatalog.
Turicode extrahiert für seine Kunden die gewünschten Daten aus unstrukturierten Dokumenten und stellt sie in strukturierter Form wieder zur Verfügung. «Mit unserer Technologie lassen sich zahlreiche Routineprozesse automatisieren», sagt der Softwareentwickler und Mitgründer Aaron Richiger, «unsere Kunden können sich vermehrt auf ihr Kerngeschäft konzentrieren.»
Der Verein Genilem wurde 1995 gegründet. Es handelt sich um eine Non-Profit Organisation, die das Schweizer Unternehmertum fördert und Gründern hilft, ihre Innovationen im Markt erfolgreich umzusetzen.