Megatron on ICE

Auto-fetch, clean JSON to NOSQL, LLAMA-indexed access to real-time building data via NLP prompts, ensuring accuracy.

📂 Demo

Auf der sitios Webseite werden umfassende Wnformationen zum Zutritt zu öffentlichen Gebäuden für menschen mit Einschränkung in der Mobilität bereitgestellt. Aufgrund der grossen Menge an Informationen ist es für die Benutzer aber oft schwierig, ihren Besuch zu planen. Unsere Lösung sammelt die vorhandenen Daten, bereinigt diese und speichert diese in einer NOSQL-Datenbank ab. Anschliessend können die Benutzer Fragen zu ihrem Besuch im jeweiligen Gebäude mittels Chatbot stellen und bekommen ihre Antwort ebenfalls als kurzen ganzen Satz. Dies erleichtert die Planung eines Besuchs und macht die Webseite von sitios attraktiver und einfacher zu nutzen.

The video pitch is available at (swiss german): OpenDataHackSG2023/videopitch/MEGATRONONICEvideopitch.mp4 at christoph · clandolt/OpenDataHackSG_2023 (github.com)

The project description is available at: clandolt/OpenDataHackSG_2023 (github.com)

Sitios Accessibility Information System

Überblick

Das Sitios Accessibility Information System wurde entwickelt, um detaillierte Informationen über die Zugänglichkeit von Gebäuden zu liefern. Die Herausforderung besteht darin, die Vielfalt der Bedürfnisse verschiedener Menschen, insbesondere solcher mit besonderen Anforderungen, zu berücksichtigen. Dieses README erklärt den Lösungsansatz und wie die Anwendung verwendet werden kann.

Aufgabenstellung

Die Aufgabenstellung besteht darin, genaue und detaillierte Informationen über die Zugänglichkeit von Gebäuden zu erfassen und für die Nutzer leicht zugänglich zu machen. Unterschiedliche Arten von Rollstühlen und individuelle Bedürfnisse machen es notwendig, dass die Informationen äußerst präzise und vielseitig sind. Das aktuelle Format der Informationen auf der Sitios-Website ist jedoch aufgrund der Menge an informationen teilweise unübersichtlich und schwer zu navigieren.

Lösungsansatz

Um die Herausforderungen der aktuellen Informationsdarstellung zu bewältigen, wurde der folgende Lösungsansatz entwickelt:

Alt text

1. Auto-fetch und Clean JSON to NOSQL

Die Lösung implementiert einen Webcrawler zum automatischen Herunterlaen der JSON-Dateien über die öffentlichen Gebäude. Diese Daten werden dann bereinigt, in einem klaren JSON-Format organisiert und in einer NOSQL-Datenbank gespeichert. Dieser Prozess gewährleistet, dass die Informationen aktuell und strukturiert sind.

Alt text

2. LLAMA-Indexed Zugriff auf Echtzeit-Gebäudedaten

Um die Zugänglichkeit der Informationen zu verbessern, verwendet die Lösung ein LLAMA-Indexierungssystem. Dieses System ermöglicht einen schnellen und effizienten Zugriff auf relevante Daten. Die LLAMA-Indexierung ist wichtig, damit das Modell die Antwort anhand der Daten übers Gebäude beantwortet und nicht mittels generativer AI irgendwelche informationen erfindet. Zudem ermöglicht das LLAMA-Indexierungssystem mit der query-Funktion gezielt nach spezifischen Informationen zu suchen.

3. NLP-gesteuerte Abfragen für Genauigkeit

Die Lösung integriert ein GPT 3.5-Turmo Natural Language Processing (NLP)-Modell, um den Nutzern die Möglichkeit zu geben, präzise Abfragen zur Zugänglichkeit von Gebäuden durchzuführen. Dies trägt dazu bei, dass die Informationen genau und relevant sind. Nutzer können Fragen in natürlicher Sprache in unterschiedlichen Sprachen stellen, und das System wird die passenden Informationen liefern.

Anwendung

Die Anwendung ist aktuell nur lokal verfügbar kann aber über dieses Github repo einfach auf einem Webserver integriert werden.

Mitwirkende

  • Christoph Landolt
  • Noah Lüchinger
  • Ruwen Frick
This content is a preview from an external site.
 

Edited (version 21)

04.12.2023 07:22 ~ christoph_landolt

Project

Edited (version 19)

04.12.2023 07:22 ~ christoph_landolt

Edited (version 17)

04.12.2023 07:21 ~ christoph_landolt

Edited (version 16)

04.12.2023 07:21 ~ christoph_landolt

Event finish

Repository updated

03.12.2023 08:41 ~ gaston_wey

Edited (version 14)

03.12.2023 08:41 ~ gaston_wey

Edited (version 13)

03.12.2023 08:41 ~ gaston_wey

Edited (version 12)

03.12.2023 08:41 ~ gaston_wey

Edited (version 10)

03.12.2023 08:39 ~ gaston_wey

Edited (version 9)

03.12.2023 08:00 ~ christoph_landolt

Edited (version 8)

03.12.2023 08:00 ~ noah_lüchinger

Edited (version 7)

03.12.2023 07:58 ~ christoph_landolt

Edited (version 6)

03.12.2023 07:56 ~ christoph_landolt

Edited (version 5)

03.12.2023 07:55 ~ christoph_landolt

new video (@christophlandolt)

readme update (umbrüche) (@christophlandolt)

readme finished (@christophlandolt)

Edited (version 4)

03.12.2023 07:08 ~ christoph_landolt

Project

video pitch created (@christophlandolt)

Merge pull request #2 from clandolt/noah

layout changed (@noahluech)

layout changed (@noahluech)

Edited (version 3)

02.12.2023 21:46 ~ christoph_landolt

Project

Edited (version 2)

02.12.2023 21:28 ~ christoph_landolt

backend and frontend connected (@christophlandolt)

backend observer connected (@christophlandolt)

Merge branch 'christoph' of https://github.com/clandolt/OpenDataHackSG_2023 into christoph (@christophlandolt)

observer added (@christophlandolt)

Merge pull request #1 from clandolt/noah

Noah (@noahluech)

Merge branch 'christoph' into noah (@noahluech)

dash app finished (@noahluech)

query the query engine (@christophlandolt)

web crawler updatet to drop unnecessary info (@christophlandolt)

Schema of json data added (@christophlandolt)

get json data from data handler (@christophlandolt)

dash app initialized (@noahluech)

Calling the data handler class from main (@christophlandolt)

data handler package created (@christophlandolt)

Abstraction class to the database created (@christophlandolt)

call the query engine from main (@christophlandolt)

query engine package (@christophlandolt)

Query engine class (@christophlandolt)

Joined the team

02.12.2023 10:21 ~ ruwen_frick

Project

Edited (version 1)

02.12.2023 09:21 ~ noah_lüchinger

Joined the team

02.12.2023 09:19 ~ noah_lüchinger

Challenge shared
Tap here to review.

02.12.2023 09:19 ~ noah_lüchinger

using project settings for WebCrawler (@christophlandolt)

env.template created (@christophlandolt)

requirements update for dot env (@christophlandolt)

Package definition ProjectSettings (@christophlandolt)

Start

 
Contributed 9 months ago by noah_lüchinger for Open Data Hack St.Gallen
All attendees, sponsors, partners, volunteers and staff at our hackathon are required to agree with the Hack Code of Conduct. Organisers will enforce this code throughout the event. We expect cooperation from all participants to ensure a safe environment for everybody.

Creative Commons LicenceThe contents of this website, unless otherwise stated, are licensed under a Creative Commons Attribution 4.0 International License.