Edited (version 21)
Megatron on ICE
Auto-fetch, clean JSON to NOSQL, LLAMA-indexed access to real-time building data via NLP prompts, ensuring accuracy.
Auf der sitios Webseite werden umfassende Wnformationen zum Zutritt zu öffentlichen Gebäuden für menschen mit Einschränkung in der Mobilität bereitgestellt. Aufgrund der grossen Menge an Informationen ist es für die Benutzer aber oft schwierig, ihren Besuch zu planen. Unsere Lösung sammelt die vorhandenen Daten, bereinigt diese und speichert diese in einer NOSQL-Datenbank ab. Anschliessend können die Benutzer Fragen zu ihrem Besuch im jeweiligen Gebäude mittels Chatbot stellen und bekommen ihre Antwort ebenfalls als kurzen ganzen Satz. Dies erleichtert die Planung eines Besuchs und macht die Webseite von sitios attraktiver und einfacher zu nutzen.
The video pitch is available at (swiss german): OpenDataHackSG_2023/video_pitch/MEGATRON_ON_ICE_video_pitch.mp4 at christoph · clandolt/OpenDataHackSG_2023 (github.com)
The project description is available at: clandolt/OpenDataHackSG_2023 (github.com)
Sitios Accessibility Information System
Überblick
Das Sitios Accessibility Information System wurde entwickelt, um detaillierte Informationen über die Zugänglichkeit von Gebäuden zu liefern. Die Herausforderung besteht darin, die Vielfalt der Bedürfnisse verschiedener Menschen, insbesondere solcher mit besonderen Anforderungen, zu berücksichtigen. Dieses README erklärt den Lösungsansatz und wie die Anwendung verwendet werden kann.
Aufgabenstellung
Die Aufgabenstellung besteht darin, genaue und detaillierte Informationen über die Zugänglichkeit von Gebäuden zu erfassen und für die Nutzer leicht zugänglich zu machen. Unterschiedliche Arten von Rollstühlen und individuelle Bedürfnisse machen es notwendig, dass die Informationen äußerst präzise und vielseitig sind. Das aktuelle Format der Informationen auf der Sitios-Website ist jedoch aufgrund der Menge an informationen teilweise unübersichtlich und schwer zu navigieren.
Lösungsansatz
Um die Herausforderungen der aktuellen Informationsdarstellung zu bewältigen, wurde der folgende Lösungsansatz entwickelt:
1. Auto-fetch und Clean JSON to NOSQL
Die Lösung implementiert einen Webcrawler zum automatischen Herunterlaen der JSON-Dateien über die öffentlichen Gebäude. Diese Daten werden dann bereinigt, in einem klaren JSON-Format organisiert und in einer NOSQL-Datenbank gespeichert. Dieser Prozess gewährleistet, dass die Informationen aktuell und strukturiert sind.
2. LLAMA-Indexed Zugriff auf Echtzeit-Gebäudedaten
Um die Zugänglichkeit der Informationen zu verbessern, verwendet die Lösung ein LLAMA-Indexierungssystem. Dieses System ermöglicht einen schnellen und effizienten Zugriff auf relevante Daten. Die LLAMA-Indexierung ist wichtig, damit das Modell die Antwort anhand der Daten übers Gebäude beantwortet und nicht mittels generativer AI irgendwelche informationen erfindet. Zudem ermöglicht das LLAMA-Indexierungssystem mit der query-Funktion gezielt nach spezifischen Informationen zu suchen.
3. NLP-gesteuerte Abfragen für Genauigkeit
Die Lösung integriert ein GPT 3.5-Turmo Natural Language Processing (NLP)-Modell, um den Nutzern die Möglichkeit zu geben, präzise Abfragen zur Zugänglichkeit von Gebäuden durchzuführen. Dies trägt dazu bei, dass die Informationen genau und relevant sind. Nutzer können Fragen in natürlicher Sprache in unterschiedlichen Sprachen stellen, und das System wird die passenden Informationen liefern.
Anwendung
Die Anwendung ist aktuell nur lokal verfügbar kann aber über dieses Github repo einfach auf einem Webserver integriert werden.
Mitwirkende
- Christoph Landolt
- Noah Lüchinger
- Ruwen Frick
Project
Event finish
Repository updated
new video (@christophlandolt)
readme update (umbrüche) (@christophlandolt)
readme finished (@christophlandolt)
Project
video pitch created (@christophlandolt)
Merge pull request #2 from clandolt/noah
layout changed (@noahluech)
layout changed (@noahluech)
Project
backend and frontend connected (@christophlandolt)
backend observer connected (@christophlandolt)
Merge branch 'christoph' of https://github.com/clandolt/OpenDataHackSG_2023 into christoph (@christophlandolt)
observer added (@christophlandolt)
Merge pull request #1 from clandolt/noah
Noah (@noahluech)
Merge branch 'christoph' into noah (@noahluech)
dash app finished (@noahluech)
query the query engine (@christophlandolt)
web crawler updatet to drop unnecessary info (@christophlandolt)
Schema of json data added (@christophlandolt)
get json data from data handler (@christophlandolt)
dash app initialized (@noahluech)
Calling the data handler class from main (@christophlandolt)
data handler package created (@christophlandolt)
Abstraction class to the database created (@christophlandolt)
call the query engine from main (@christophlandolt)
query engine package (@christophlandolt)
Query engine class (@christophlandolt)
Joined the team
Project
Joined the team
Challenge shared
Tap here to review.
using project settings for WebCrawler (@christophlandolt)
env.template created (@christophlandolt)
requirements update for dot env (@christophlandolt)
Package definition ProjectSettings (@christophlandolt)
Start
Previous
Open Data Hack St.Gallen
Next project