Решая задачи наших клиентов, подбираются источники данных. Это могут быть как структурированные, так и не структурированные данные; сильно или слабо формализованные; базы данных, сайты, информационные системы. Мы научились извлекать данные практически из любых источников, получать их с устройств.
Для работы с популярными источниками данных мы используем библиотеку драйверов, для работы с популярными в России системами разработали библиотеку коннекторов. Для получения данных из нестандартных источников или сайтов пишем коннекторы или "граберы".
Данные из текстов, неструктурированной информации, мы извлекаем используя семантические движки компаний партнеров: RCO, AvicompServices.
Формируя аналитическое информационное хранилище, используем принципы онтологического подхода. Настроили коннектор к формату RDF для трансляции предметной области. 
Формирование информационного аналитического хранилища происходит с соблюдением условий уникальности данных, качества данных, установления связей, контроля форматов и логики. 
Популярные источники данных представлены на этой страницы.