Data Quality
Informatica Data Quality – это полнофункциональная платформа для оценки, контроля и управления качеством данных в масштабах предприятия. Полномасштабное решение Data Quality позволяет на уровне настраиваемых бизнес-правил распознавать, проверять, стандартизировать и очищать любые данные; выявлять дубликаты и взаимосвязи между такими данными, как, например, имена (ФИО), адреса, названия, номенклатуры, реквизиты и др., существующими в различных системах предприятия.
Функционал решения включает в себя возможности исправлять написание отдельных строк, устанавливать пороговые значения на число ошибок в написании и другие возможности. Данный функционал платформы по праву считается одним из лучших на рынке.
Informatica Data Quality включает в себя следующие модули:
· сервер обработки Data Quality, позволяющий выполнять процессы анализа качества, очистки, проверки, стандартизации и дедупликации данных;
· клиентское приложение Informatica Data Quality Workbench для разработки и тестирования процессов обеспечения качества данных;
· клиентское приложение Informatica Data Quality Assistant для ручной обработки данных, не прошедших автоматическую обработку или являющихся кандидатами на дубликаты.
Типы проектов, в которых необходимо обеспечение качества данных:
o Построение хранилищ данных,
o Миграция и консолидация данных,
o Синхронизация данных,
o Управление нормативно-справочной информацией,
o Одноразовая очистка данных,
o Очистка данных он-лайн.
Ключевые возможности
Очистка данных
Informatica Data Quality включает в себя мощные возможности анализа, профилирования, разбора и очистки данных, позволяющие архитекторам и аналитикам осуществлять проверку и стандартизацию данных, улучшать и корректировать любые типы данных, включая информацию о заказчиках, продуктах, финансовых и других данных.
Решение позволяет идентифицировать, сравнивать, анализировать и стандартизировать текстовые и числовые данные произвольной формы с помощью легко настраиваемых бизнес-правил, что в значительной степени помогает автоматизировать процессы очистки и трансформации данных.
Informatica Data Quality позволяет бизнес-специалистам управлять решениями по проверке и обеспечению качества данных для снижения операционных рисков.
Решение позволяет проводить очистку данных по запросу, по расписанию или в режиме реального времени.
Сопоставление данных (Data Matching)
Informatica Data Quality содержит в себе множество мощных и гибких инструментов для сравнения данных, которые позволяют аналитикам и архитекторам определять связи между записями и наличие дубликатов для проведения последующей унификации данных.
Informatica Data Quality представляет собой набор вероятностных методов для проведения сравнения данных, опирающийся на фонетические и синтаксические особенности написания.
Благодаря опции Identity Match Option существует возможность поиска, сравнения и идентификации путем использования «нечеткой» логики. Эта опция позволяет распознавать информацию на 60 языках мира.
Informatica Data Quality предоставляет максимальную прозрачность функций стандартизации и сравнения данных, что позволяет конечным пользователям получить целостный взгляд и контроль за процессами обеспечения качества данных.
Отчетность и мониторинг качества данных
Informatica Data Quality включает в себя функции мониторинга и динамического формирования отчетности о качестве данных. Это позволяет организациям обеспечивать управление качеством поступающих данных с помощью единого, простого в использовании решения.
Data Quality предоставляет специальные графические средства, которые отражают ключевые характеристики качества данных, такие как полнота, согласованность, связность, точность, целостность и отсутствие дубликатов.
Подробные отчеты позволяют бизнес-аналитикам самостоятельно проверять данные с низким качеством из любого корпоративного приложения. Аналитики могут создавать графические панели (dashboards), которые затем можно экспортировать в BI-системы или размещать на Intranet-сайтах компании, что позволит аналитикам постоянно отслеживать качество данных систем предприятия.
Открытые словари
В решениях, обеспечивающих качество данных, Informatica Data Quality использует открытые текстовые словари, которые могут быть созданы или адаптированы в любом текстовом приложении.
Словари, созданные компанией Informatica, специалистами заказчиков или других компаний, можно использовать одновременно для анализа и стандартизации данных, а также для построения правил проверки качества данных.
Подобные словари обладают всеми возможностями чтения/записи и по своей функциональности сходны с Microsoft Excel. Они предоставляют гибкое и легкое в использовании решение, основанное на внутренних и внешних справочных данных.
Поставка содержит следующие наборы словарей, приведенных к работе с российскими данными:
· Фамилии, Имена, Отчества;
· Адреса согласно КЛАДР;
· Наборы префиксов (к адресам, к именам и т.д.);
· Телефонные коды городов;
· Индексы населенных пунктов;
· Правовые формы организаций;
· Проверка ИНН и др.
Поддержка всех типов данных
Ни одно другое решение не предоставляет такую широкую поддержку различных типов источников и приемников данных, как Informatica Data Quality.
Informatica Data Quality используется коммерческими и государственными компаниями любых сфер деятельности для управления качеством таких данных, как:
- финансовые данные,
- клиентские данные,
- информация о продуктах, ценах, компаниях,
- данные об именах, адресах, телефонах, электронных адресах,
- промышленные классификаторы,
- любые другие виды данных.
Глобальная языковая поддержка
Informatica Data Quality обеспечивает глобальную мультиязыковую поддержку. Решение поддерживает Unicode, что позволяет использовать не только латинские, но и другие наборы символов. За счет подобной совместимости Informatica Data Quality поддерживает такие языки, как, русский, украинский, казахский и др. Например, представительством Informatica в России уже разработаны конкретные процедуры по автоматической обработке данных русских ФИО и адресов.
Высокий уровень масштабируемости
Решение Data Quality совместимо с различными операционными системами, включая Windows, Linux и Unix.
Существует несколько режимов работы данного программного обеспечения:
- интерактивный – запуск процессов для проверки и обеспечении качества данных по запросу или по расписанию
- выполнение процессов в режиме реального времени (например, как часть процессов другого приложения типа CRM, call-center).
Решение поддерживает работу многочисленных пользователей в единой среде. Оно также позволяет создавать механизмы для очистки данных в системах-источниках с возможностью возвращать неочищенные данные для их повторной очистки.
Помимо этого, решение Informatica Data Quality способно выполнять комплексные процессы профилирования и обеспечения качества данных.
Интеграция с SAP и Oracle
Informatica Data Quality поддерживает следующие решения Oracle и SAP:
· продукт сертифицирован для работы с Oracle Universal Customer Master (UCM) и Oracle CRM, поддерживает очистку, а также нечеткое соответствие данных в указанных продуктах, при этом возможна обработка всех типов данных;
· продукт полностью поддерживает процессы, обеспечивающие качество данных нормативно-справочной информации в SAP, возможно использование процессов очистки и стандартизации для других видов данных в приложениях SAP.
Полная интеграция с Informatica PowerCenter
Informatica Data Quality тесно связана с платформой интеграции данных Informatica PowerCenter. Используя PowerCenter Designer, можно создать проверку качества данных непосредственно внутри интеграционного процесса. Существует набор трансформаций, встроенных в PowerCenter, позволяющих вызывать и использовать процессы обеспечения качества данных Informatica Data Quality.
Интеграция с PowerCenter существенно повышает скорость разработки, что позволяет упростить выполнение сложных и объемных вычислительных операций и ускорить адаптацию разработчиков к изменяющимся требованиям бизнеса.
Взаимодействие Informatica Data Quality c PowerCenter предоставляет возможность использовать и передавать данные во все типы приложений и баз данных, которые поддерживаются платформой PowerCenter.
Полная интеграция с Metadata Manager
Data Quality обеспечивает полную интеграцию с Metadata Manager в целях отслеживания зависимостей метаданных от источников данных до полей отчётов.
Более подробная информация об опциях Informatica Data Quality - www.informatica.com, о приложениях Informatica Data Quality - www.informatica.com
