Скритото знание в базите данни -

август 8, 20210

От Енея Георгиева
Тодор Примов, експерт семантични решения в здравеопазването и фармацията. Снимка: Онтотекст

Онтотекст е световен доставчик на продукти и решения в областта на семантичните технологии и базите данни. Компанията интегрира големи обеми от структурирани и неструктурирани данни, автоматизира достъпа до знанието в тях и на негова база прави анализи. По този начин Сирма Ей Ай, по-известна като Онтотекст, подпомага на редица организации. За да разберем повече за технологията, проведохме интервю с Тодор Примов ръководител отдел “Семантични решения за здравеопазването и фармацията” в Онтотекст – член на  Българският клъстер за дигитални решения и иновации в здравеопазването (DHI Cluster Bulgaria).

Г-н Примов, какво е предназначението на семантичните технологии и как те помагат на компаниите да управляват съдържанието си по-ефективно?

Семантичните технологии не са нещо ново и неприложимо. Те следват естествената еволюция на развитие на технологичните инструменти от ежедневието ни. Визията на пионери в областта на интернет като сър Тим

Бърнърс Лий (бел. ред. британски компютърен учен, посветен в рицарство заради създаването на интернет формата World Wide Web – WWW) също оказва влияние. Заради това след web 2.0 (ерата на социалните мрежи) сега вече живеем в web 3.0 (семантичен/свързан уеб). Основната добавена стойност на семантичните технологии и всички инструменти, с които те си служат, като граф базите данни например, е да предоставят възможност да се проследят всички възможни връзки между отделни факти/единици знание.

Те биха били от значение за конкретния бизнес или научно приложение. Например за един общопрактикуващ лекар би било много полезно, ако получава автоматично известие за несъвместимост на лекарства. Така ако той предписва ново лекарство на свой пациент веднага ще разбере каква е съвместимостта с медикаментите, които се прилагат в момента. 

Откриването и анализът на информация са важна част от работата на редица сектори. С какво се отличава здравеопазването и фармацията при използването на Вашите услуги?

И двата сектора работят с огромни обеми данни на ежедневна база. Те са от най-различно естество – вътрешни и публично достъпни, добре структурирани или напълно неструктурирани и т.н. Много често, поради липса на ресурси, време и адекватни технологични решения, компаниите не успяват да извлекат максимума от данните, с които разполагат. Това води до неефективни рабортни процеси, ненавременно и неточно позициониране на пазари и съответно финансови загуби. Не случайно в основата на дигиталната трансформация е именно по-ефективния начин на събиране, свързване и анализ на данните и информацията. 

Вие помагате на световно признати компании като BBC, Financial Times и Press Association да предоставят динамично и персонализирано съдържание на своите читатели. От вашата практика кои компании и професии разчитат най-много на специализираната работа с данни?

Истината е, че нуждата от по-ефективни процеси по анализ на данни е вече повсеместна. Не мога да се сетя за индустриален сектор, в който понастоящем да не се налага да се внедряват по-ефективни процеси за анализ на данни. Именно тук идва ролята на семантичните технологии и граф базите данни, с които работим ние. Чрез тях ние помагаме на бизнеса да превърне данните си в един от основните активи на компанията. С тях могат да се вземат много по-навременни и адекватни решения.

Пандемията от COVID-19 увеличи ли интересът към семантичните технологии?

Глобалната пандемия от COVID-19 ускори значително навлизането на редица нови технологии във всекидневната работа на компаниите, включително и на семантичните технологии и граф базите данни. През този период имахме възможността да подкрепим водещи изследователски световни проекти свързани със събиране и анализ на данни за COVID-19. Също така обаче и започнахме мащабни проекти с водещи фармацевтични компании, големи болнични заведения и здравни застрахователи.

Какво е важно при развиването на международна компания за нишова технология в България?

Независимо, че централата на Онтотекст е в България, ние гледаме на себе си като на глобална компания с активно присъствие на няколко континента. Клиенти ни са в някои от най-значимите индустриални сектори като здравеопазване, фармация, финансово дело, автомобилната промишленост и аеронавтика и т.н. За да бъдем конкурентни в световен мащаб, ние залагаме на комбинация от солидно технологично развитие, зрели продукти и решения, тясна домейн експертиза и познаване на фокусните за компанията индустриални вертикали.

Какво да очакваме от развитието на семантичните технологии през следващите години?

Понастоящем семантичните технологии се използват предимно за структуриране/извличане на знание от съдържание. Този процес е създаден по “старомодния” начин – без грижа за еднозначното наименоване и рефериране на обектите представени в данните. Самия процес за създаване на съдържание и описание на данни е необходимо да бъде базиран на семантичните технологии. Посредством използването на онтологии и специфични терминологии, те ще позволяват еднозначното наименование на обектите и семантичните връзки между тях. Така още при самото си създаване информацията ще бъде “семантична”. В този вид тя е готова за употреба от различни роботизирани системи (ботове), да се използва за машинно самообучение или за разработването на невронни мрежи, които са в основата на системи с изкуствен интелект. 

По какви приложения на семантичните технологии сте работили в България и как допринася Българският клъстер за дигитални решения и иновации в здравеопазването (DHI Cluster Bulgaria) за популяризирането на тези технологии?

През годините сме имали различни запитвания за проекти в България от индустриални сектори като медии, финансови институции, фармация, здравеопазване, изследователски организации и т.н. Общо за всички тях е нуждата от автоматизиран анализ на големи обеми от динамични и сложни, структурирани и неструктурирани данни за конкретни бизнес цели, като например: увеличаването на ангажираността на потребителите и по-ефективното обслужване на запитвания, оптимизирането на процесите за обмен и взимане на решения, изцяло базирани  на данни и т.н.

Българският клъстер за дигитални решения и иновации в здравеопазването (DHI), който съществува едва от три години, има безспорна роля за популяризирането на новите технологии за анализ на данни и споделянето на примери за практическото им приложение при разрешаването на конкретни проблеми в сектора на здравеопазването. Чрез редица инициативи на национално ниво Клъстерът и създадената от него екосистема от експерти в най-различни области на здравеопазването направи възможно споделянето и обмена на добри практики, включително и в областта на анализа на здравни данни, което допринесе за по-голяма информираност сред бизнеса и институциите за реалния потенциал на тези технологии.

DHI ClusterУправление

Български клъстер за дигитални решения и иновации в здравеопазването.

МестоположениеКъде да ни намерите?

DHI Cluster

Свържете се с насDHI Cluster социални мрежи

DHI ClusterУправление

Български клъстер за дигитални решения и иновации в здравеопазването.

Свържете се с насDHI Cluster социални мрежи

© 2020 DHI Cluster. Всички права запазени.

© 2020 DHI Cluster. Всички права запазени.