Zum Hauptinhalt springen

Abschlussarbeit Big Data - PDF-Datenextraktion

Abschlussarbeit Big Data - PDF-Datenextraktion

in Berlin

Jetzt bewerben
13053 Berlin Vollzeit

Zeit für deine Zukunft. Zeit für Würth.

Würth ist führender Hersteller von Befestigungstechnik für die professionelle Anwendung. Als echte Macherinnen und Macher sind wir stets mit Leidenschaft bei der Sache. Hohe Eigenmotivation, große Gestaltungsfreiräume und eine starke Kollegialität zeichnen die Kultur in unserem Familienunternehmen Würth aus. Ein Praktikum bei Würth bietet dir den perfekten Baustein für deine berufliche Karriere. Klingt das gut für dich? Dann entdecke jetzt deine Einstiegsmöglichkeiten und werde Teil der Würth Familie. Es ist Zeit für eine neue Herausforderung.

Das erwartet dich

Big Data, Künstliche Intelligenz und Machine Learning werden in der heutigen Geschäftswelt immer wichtiger. Das Big Data Berlin Team ist verantwortlich für die Entwicklung von datengestützten Software-Produkten für die Adolf Würth GmbH. Sei ein Pionier und trage zur digitalen Transformation des Handwerks bei. Dieses Projekt zielt darauf ab, eine flexible und robuste Lösung zur Extraktion von Daten aus PDF-Dokumenten zu entwickeln. Da PDF-Dokumente häufig als Datenquellen verwendet werden, jedoch sehr unterschiedliche Strukturen aufweisen können, besteht ein erheblicher Bedarf an einer einheitlichen Lösung, da die diese Vielfalt abdeckt und in einen automatisierten Prozess überführt.
Folgende Aufgaben warten auf dich:

  • Vielfältige Dokumentenstruktur:Entwicklung eines Services, der mit verschiedenen Arten von PDFs umgehen kann,unabhängig davon, ob es sich um digital-erzeugte Dokumente mit Text- undBildebene oder gescannte Dateien handelt.
  • Einheitliche Lösung:Schaffung einer einheitlichen Methode zur zuverlässigen Datenextraktion ausunterschiedlich formatierten PDFs.
  • Visueller Vergleich:Implementierung einer Funktion, die den visuellen Vergleich zwischen demOriginaldokument und den extrahierten Informationen ermöglicht, um dieGenauigkeit der Extraktion zu überprüfen.
  • Leistungsnachweise:Spezielle Anwendung zur Extraktion von Informationen aus Leistungsnachweisen,die oft in PDF-Form vorliegen und für die Weiterverarbeitung standardisiertwerden müssen.
  • Ad-Hoc Dokumente:Informationsextraktion aus fotografierten oder gescannten Dokumentenverschiedenster Herkunft.
  • Technologienrecherche:Untersuchung und Bewertung bestehender Technologien und Methoden zurPDF-Verarbeitung und Datenextraktion.
  • Setup und Vorbereitungvon Testdaten: Sammlung und Aufbereitung von PDF-Dokumenten unterschiedlicherFormate und Strukturen für die Entwicklung und das Testen.
  • Serviceentwicklung aufAWS: Implementierung und Bereitstellung des Datenextraktors als Cloud-basierterService auf AWS, um Skalierbarkeit und Zuverlässigkeit sicherzustellen.

Das erwarten wir

  • Master-Studium in einem MINT-Bereich, z.B. Informatik, Statistik, Mathematik oder vergleichbaren quantitativen Disziplinen (Biochemie, Astronomie, empirische Sozialforschung, Computerlinguistik, Supply Chain Management, etc.)
  • Erste Erfahrungen in der Verarbeitung und Analyse von Daten
  • Erste Erfahrungen mit Big-Data-Technologien und Kodierung in SQL und Python
  • Erfahrungen in derAnwendung von Bibliotheken wie PyTorch, Transformers, PEFT, FAISS und OpenCV
  • Du hast Interesse an denThemen Cloud-Technologien (z.B. Databricks, AWS, GCP, Azure) undBig-Data-Architekturen und -Technologien (z.B. Apache Spark, Kafka, Elastic)
  • Verhandlungssichere Englischkenntnisse und gute Deutschkenntnisse

Wir bitten dich bei deiner Bewerbung auf das Thema einzugehen.

Das bieten wir dir

Dich erwarten eine Welcome-Veranstaltung und fachübergreifende Einblicke in verschiedenste Abteilungen. Außerdem kannst du dich auf ein starkes Netzwerk und gemeinsame Aktivitäten freuen. Werde Teil der Würth-Familie und sammle Praxiserfahrung in einem familiären und herzlichen Arbeitsklima!
Unser Versprechen an dich: Kein Tag bei Würth wird langweilig sein!
Zeitraum der Arbeit:
Flexibel, idealerweise ab März 2025 für 6 Monate
Arbeitsort: In unserem Office in Berlin Adlershof (min. 2 Tage in der Woche) und im Mobile Office (Home Office).
Praktikumsvergütung:

  • 1.400 € brutto pro Monat: Pflichtpraktikum
  • 2.262 € brutto pro Monat: Freiwilliges Praktikum/Abschlussarbeit (4-6 Monate)

Überzeugt?

Haben wir Dein Interesse geweckt? Dann freuen wir uns auf Deine Bewerbung über unser Online-Bewerbungsformular.
Adolf Würth GmbH & Co. KG · 74650 Künzelsau
T +49 7940 15 6109 · patricia_karolin.fink@wuerth.com · www.wuerth.de/karriere
Jetzt bewerben

Dies ist eine auf dritten Jobbörsen gefundene Stellenanzeige. Wir bieten hierfür keinen Support, können diese aber jederzeit offline stellen. Für weitere Informationen: Datenschutzhinweise | Anzeige melden.

Abschlussarbeit Big Data - PDF-Datenextraktion

A. Würth GmbH + Co. KG
Berlin
Vollzeit, Praktikum / Werkstudent

Veröffentlicht am 25.12.2024

Jetzt Job teilen