Технология Интеллектуального Анализа Данных Data Mining

Технология Интеллектуального Анализа Данных Data Mining

Методы интеллектуального анализа данных. Мартин Браун Martin C. Brown Опубликовано 0. Серия контента Этот контент является частью из серии статей https www. Принципы интеллектуального анализа данных известны в течение многих лет, но с появлением больших данных они получили еще более широкое распространение. Большие данные привели к взрывному росту популярности более широких методов интеллектуального анализа данных, отчасти потому, что информации стало гораздо больше, и она по самой своей природе и содержанию становится более разнообразной и обширной. При работе с большими наборами данных уже недостаточно относительно простой и прямолинейной статистики. RetailDataMining_image6.gif' alt='Технология Интеллектуального Анализа Данных Data Mining' title='Технология Интеллектуального Анализа Данных Data Mining' />Имея 3. Чтобы лучше удовлетворить потребности покупателей, необходимо понять, принадлежат ли эти два миллиона к определенной возрастной группе, и знать их средний заработок. Эти бизнес требования привели от простого поиска и статистического анализа данных к более сложному интеллектуальному анализу данных. Для решения бизнес задач требуется такой анализ данных, который позволяет построить модель для описания информации и в конечном итоге приводит к созданию результирующего отчета. Модели интеллектуального анализа данных могут применяться к. Интеллектуальные информационные системы в управлении знаниями middot Интеллектуальный. DataMining это процесс обнаружения полезных знаний о бизнесе. Н. М. Абдикеев КБА. Data Mining рус. Развитие технологий баз данных сначала привело к созданию специализированного языка языка запросов к базам данных. Введение в Data Mining, подготовка и предварительный анализ данных. Общая концепция методологии Data Mining и технологии реализации в пакете. Data mining интеллектуальный анализ данных, добыча данных. Технология Data Mining позволяет выявить среди больших объемов данных. В технологии Data Mining гармонично объединились строго формализованные методы и методы неформального анализа, т. Data Mining интеллектуальный анализ данных. В основу современной технологии Data Mining discoverydriven data mining положена концепция. Кафедра экономической кибернетики. Технология Data Mining Интеллектуальный Анализ Данных. Степанов Роман Григорьевич. Казань, 2008. Принципы интеллектуального анализа данных известны в. Data mining страница Википедии об интеллектуальном анализе данных. Этот процесс иллюстрирует рисунок 1. Схема процесса. Кликните, чтобы увидеть увеличенное изображение. Процесс анализа данных, поиска и построения модели часто является итеративным, так как нужно разыскать и выявить различные сведения, которые можно извлечь. Необходимо также понимать, как связать, преобразовать и объединить их с другими данными для получения результата. После обнаружения новых элементов и аспектов данных подход к выявлению источников и форматов данных с последующим сопоставлением этой информации с заданным результатом может измениться. Интеллектуальный анализ данных. Интеллектуальный анализ данных можно выполнить с относительно скромными системами баз данных и простыми инструментами, включая создание своих собственных, или с использованием готовых пакетов программного обеспечения. Сложный интеллектуальный анализ данных опирается на прошлый опыт и алгоритмы, определенные с помощью существующего программного обеспечения и пакетов, причем с различными методами ассоциируются разные специализированные инструменты. Например, IBM SPSS. В последнее время стала возможна работа с очень большими наборами данных и кластернаякрупномасштабная обработка данных, что позволяет делать еще более сложные обобщения результатов интеллектуального анализа данных по группам и сопоставлениям данных. Сегодня доступен совершенно новый спектр инструментов и систем, включая комбинированные системы хранения и обработки данных. Можно анализировать самые разные наборы данных, включая традиционные базы данных SQL, необработанные текстовые данные, наборы. Кластерные базы данных, такие как Hadoop, Cassandra, Couch. DB и Couchbase Server, хранят и предоставляют доступ к данным такими способами, которые не соответствуют традиционной табличной структуре. В частности, более гибкий формат хранения базы документов придает обработке информации новую направленность и усложняет ее. Базы данных SQL строго регламентируют структуру и жестко придерживаются схемы, что упрощает запросы к ним и анализ данных с известными форматом и структурой. Документальные базы данных, которые соответствуют стандартной структуре типа JSON, или файлы с некоторой машиночитаемой структурой тоже легко обрабатывать, хотя дело может осложняться разнообразной и переменчивой структурой. Принтер Epson L110 Инструкция. Например, в Hadoop, который обрабатывает совершенно. Основные методы. Несколько основных методов, которые используются для интеллектуального анализа данных, описывают тип анализа и операцию по восстановлению данных. К сожалению, разные компании и решения не всегда используют одни и те же термины, что может усугубить путаницу и кажущуюся сложность. Рассмотрим некоторые ключевые методы и примеры того, как использовать те или иные инструменты для интеллектуального анализа данных. Ассоциация. Ассоциация или отношение, вероятно, наиболее известный, знакомый и простой метод интеллектуального анализа данных. Для выявления моделей делается простое сопоставление двух или более элементов, часто одного и того же типа. Например, отслеживая привычки покупки, можно заметить, что вместе с клубникой обычно покупают сливки. Создать инструменты интеллектуального анализа данных на базе ассоциаций или отношений нетрудно. Например, в Info. Sphere Warehouse есть мастер, который выдает конфигурации информационных потоков для создания ассоциаций, исследуя источник входной информации, базис принятия решений и выходную информацию. На рисунке 2 приведен соответствующий пример для образца базы данных. Рисунок 2. Информационный поток, используемый при подходе ассоциации. Кликните, чтобы увидеть увеличенное изображение. Классификация. Классификацию можно использовать для получения представления о типе покупателей, товаров или объектов, описывая несколько атрибутов для идентификации определенного класса. Например, автомобили легко классифицировать по типу седан, внедорожник, кабриолет, определив различные атрибуты количество мест, форма кузова, ведущие колеса. Изучая новый автомобиль, можно отнести его к определенному классу, сравнивая атрибуты с известным определением. Те же принципы можно применить и к покупателям, например, классифицируя их по возрасту и социальной группе. Кроме того, классификацию можно использовать в качестве входных данных для других методов. Например, для определения классификации можно применять деревья принятия решений. Кластеризация позволяет использовать общие атрибуты различных классификаций в целях выявления кластеров. Кластеризация. Исследуя один или более атрибутов или классов, можно сгруппировать отдельные элементы данных вместе, получая структурированное заключение. На простом уровне при кластеризации используется один или несколько атрибутов в качестве основы для определения кластера сходных результатов. Кластеризация полезна при определении различной информации, потому что она коррелируется с другими примерами, так что можно увидеть, где подобия и диапазоны согласуются между собой. Метод кластеризации работает в обе стороны. Можно предположить, что в определенной точке имеется кластер, а затем использовать свои критерии идентификации, чтобы проверить это. График, изображенный на рисунке 3, демонстрирует наглядный пример. Здесь возраст покупателя сравнивается со стоимостью покупки. Разумно ожидать, что люди в возрасте от двадцати до тридцати лет до вступления в брак и появления детей, а также в 5. Кластеризация. Кликните, чтобы увидеть увеличенное изображение. В этом примере видны два кластера, один в районе 2. В данном случае мы выдвинули гипотезу и проверили ее на простом графике, который можно построить с помощью любого подходящего ПО для построения графиков. Для более сложных комбинаций требуется полный аналитический пакет, особенно если нужно автоматически основывать решения на информации о ближайшем соседе. Такое построение кластеров являет собой упрощенный пример так называемого образа ближайшего соседа. Отдельных покупателей можно различать по их буквальной близости друг к другу на графике. Весьма вероятно, что покупатели из одного и того же кластера разделяют и другие общие атрибуты, и это предположение можно использовать для поиска, классификации и других видов анализа членов набора данных. Метод кластеризации можно применить и в обратную сторону учитывая определенные входные атрибуты, выявлять различные артефакты. Например, недавнее исследование четырехзначных PIN кодов выявили кластеры чисел в диапазонах 1 1. Изобразив эти пары на графике, можно увидеть кластеры, связанные с датами дни рождения, юбилеи. Прогнозирование. Прогнозирование. В сочетании с другими методами интеллектуального анализа данных прогнозирование предполагает анализ тенденций, классификацию, сопоставление с моделью и отношения. Анализируя прошлые события или экземпляры, можно предсказывать будущее.

Технология Интеллектуального Анализа Данных Data Mining
© 2017