→

Інтернет та суспільство →  Компанія Google має намір зайнятися оцифровуванням текстів з друкованих ЗМІ

Нова технологія дозволить зібрати воєдино графічно різнорідні елементи статті — заголовки, текст та ілюстрації. Винахід допоможе видавцям газет і журналів скласти електронний архів публікацій.
Технологія, запропонована Google, передбачає два етапи розпізнавання: сегментування блоків і сегментування статей. У ході сегментації блоків програма розбиває статтю на окремі елементи — текст, заголовки, підзаголовки, картинки, а потім визначає, належать ці елементи до однієї статті або до різних, і встановлює послідовність, в якій вони повинні бути розташовані.

Джерело: IT-ІМК
Написав
01.03.2010 в 15:50
|
0

Актуальне ↓