Textbausteine
Textbausteine in Urteilen markieren
Um schnell zu erkennen, was in einem Urteil neu ist, sollen immer wieder verwendete Textbausteine eingefärbt werden.
In jedem Urteil finden sich Textbausteine, die zuvor schon in zahlreichen anderen Urteilen zu lesen waren. Diese Challenge soll ein Tool hervorbringen, das zeigt, welche Textelemente in einem Urteil tatsächlich neu sind und welche schon in vielen anderen Urteilen enthalten waren. Dies kann durch Einfärbung oder Ausblenden oder Einklapp- bzw. Ausklapp-Funktion ermöglicht werden.
Event finish
2 years ago
~
ilya_skurikhin
Joined the team
2 years ago
~
ilya_skurikhin
- consider implementing a consistent syntax to be used for all future BGEs (structured, ie. XML- or JSON-based)
2 years ago
~
jesus_zen_drod
Conclusions relative to HTML parser: - works reasonably well so far, there may be some occasional data loss - too many inconsistencies in the text data to reliably re-structure the data ; human post-processing of the script output is a must.
2 years ago
~
jesus_zen_drod
splitting references to extract their Art./Abs./lit. components.
2 years ago
~
jesus_zen_drod