Tematikus, strukturált, nyomtatott oldalak szövegének felismerése Javában

Konzulens:
Dr. Goldschmidt Balázs
Külső konzulens vagy kontakt:
Dr. Surányi Gábor (Morgan Stanley)
External supervisor e-mail:
budapest-uni@morganstanley.com
Tárgy:
Önálló laboratórium - Szoftverfejlesztés és rendszertervezés specializáció, BSc Info.
Önálló laboratórium 1 - Vizuális informatika főspecializáció, MSc Info.
Önálló laboratórium 2 - Vizuális informatika főspecializáció, MSc Info.
Hallgatói létszám:
2
Folytatás:
Szakdolgozat / Diplomaterv
Leírás:
Morgan Stanley témakiírás

Karakter- ill. szövegfelismerési probléma esetén ma már rengeteg szolgáltatás és könyvtár áll a fejlesztő rendelkezésre. A legtöbbjük általános célú, csupán a képet alakítja szöveggé, de semmiféle támpontot nem nyújt bizonyos elemek azonosításához. Pedig strukturált oldalak  digitalizálása esetén ez a következő lépés, amelyet el kell végezni.
 
A hallgató(k) feladata olyan alkalmazás készitse, amely számlák képéből egy külső karakterfelismerő program által előállitott nyers szövegből a számlák adatait (eladó adatai, vásárlás helye és időpontja, vásárolt tételek, mennyiségek és összegek stb.) kinyeri.

Angol szöveg (dokumentáció) olvasás alapján történő megértése a téma felvételének előfeltétele.