Logo ru.artbmxmagazine.com

Сбор данных

Оглавление:

Anonim

Что-то, что обычно хуже, чем отсутствие информации, - это иметь много информации и не знать, как с ней обращаться. За последние годы человечество развило огромные способности и возможности генерировать и собирать данные, потому что есть машины, которые могут обрабатывать их при низкой стоимости хранения.

Но, тем не менее, в этих огромных объемах данных есть много скрытой информации, которая имеет большое значение, но к которой невозможно получить доступ с помощью классических методов поиска информации.

Все раскрытие этой информации возможно благодаря интеллектуальному анализу данных или Datamining, среди прочих характеристик, которые мы увидим при разработке этой статьи, - это использование искусственного интеллекта, который позволяет определять закономерности и взаимосвязи в данных, позволяя создание моделей.

В ходе разработки данной статьи будет раскрыта тематика интеллектуального анализа данных, каковы его характеристики, методология и основные области применения.

Ключевые слова:

  • Интеллектуальный анализ данныхИнформационный анализОбработка данныхБазы данных

СБОР ДАННЫХ

Общее

Любопытно, что в эпоху, в которой мы сейчас живем, считается веком информации, поскольку благодаря ей мы можем быстро узнавать о событиях по всему миру, данные могут образовывать запутанную и пеструю стену.,

Сырье, используемое для принятия решений, не всегда является самым доступным, поэтому необходимо пойти и поискать его, и хотя это кажется простым, это не так, поскольку необходимо выборочно извлекать данные для получения экономической выгоды.

Все это известно как интеллектуальный анализ данных, хотя позже он будет определен правильно, это все равно, что сказать, что если гномы Белоснежки приступили к работе, чтобы найти драгоценные камни, им также пришлось бы взять подходящие кирки и лопаты, чтобы их достать. В этом случае можно было бы получить правильную информацию.

Основная цель интеллектуального анализа данных - извлечь информацию из набора данных, обработать ее и отшлифовать, чтобы можно было преобразовать ее в структуру, понятную для дальнейшего использования.

Организации, использующие интеллектуальный анализ данных, могут быстро увидеть окупаемость своих инвестиций, поскольку они перестают делать неправильные шаги. Приложение - это определение потребительских привычек в супермаркете. (Дуран Мена, 2014)

Что такое интеллектуальный анализ данных?

Вот несколько определений интеллектуального анализа данных от разных авторов:

  • Интеллектуальный анализ данных - это процесс, который позволяет вам обнаруживать дополнительную информацию из больших наборов данных, поскольку он использует математический анализ, который позволяет выявлять закономерности и тенденции, существующие в данных. (SQL Server, 2014) Интеллектуальный анализ данных - это процесс, направленный на извлечение, обнаружение и хранение определенной информации, относящейся к большим базам данных, с помощью программ поиска и других индикаторов, которые имеют объяснение и могут быть обнаружены применяя эти инструменты. (Ларриета и Сантильян Гомес, 2007 г.) Интеллектуальный анализ данных, также известный как «открытие данных или знаний», представляет собой процесс анализа данных с различных точек зрения и их обобщения в полезную информацию. (Информационные технологии,2009) Датамайнинг или интеллектуальный анализ данных - это набор методов и технологий, которые позволяют автоматически или полуавтоматически исследовать большие базы данных, чтобы находить повторяющиеся закономерности, тенденции или правила, позволяющие объяснить поведение данных в данном контексте. (Sinnexus, 2007)

Применение интеллектуального анализа данных

(SQL Server, 2014 г.) Модели интеллектуального анализа данных можно применять в следующих сценариях:

  • Прогноз: позволяет рассчитывать продажи и прогнозировать нагрузки или время простоя сервера. Риск и вероятность: помогает выбрать лучших клиентов для правильного распределения почты и назначает диагностические вероятности или некоторые другие результаты. Рекомендации: используются для определения продуктов. которые можно продавать вместе и генерировать некоторые рекомендации. Последовательности поиска: анализируйте товары, которые клиенты добавили в корзину, и таким образом прогнозируйте возможные события. Группирование: разделяйте клиентов или события на определенные кластеры и таким образом анализируйте или прогнозируйте сходство

Основные характеристики и цели Data Mining

(Vallejos, 2006) Наиболее важными характеристиками интеллектуального анализа данных являются:

  • Исследуйте данные, расположенные глубоко в базах данных или хранилищах данных, поскольку они, как правило, со временем хранят большой объем информации. В некоторых случаях эти базы данных или хранилища данных становятся рынками данных или обычно хранятся в Интернет- или интранет-серверы Внешняя среда майнинга - это, как правило, взаимоотношения между сервером и клиентом. Инструменты сбора данных помогают извлекать информационную руду, которая хранится в корпоративных архивах или общедоступных записях. информации:
  • Ассоциации Классификации Последовательности Прогнозы Группировки

При интеллектуальном анализе данных данные отбираются в надежде, что на их основе возникнут какие-то гипотезы, и данные ищутся, чтобы описать или указать, почему они такие, какие они есть.

Впоследствии гипотеза подтверждается, и, следовательно, интеллектуальный анализ данных должен представлять собой исследовательский подход, хотя использование сбора данных для подтверждения гипотез несколько опасно, поскольку делается в некоторой степени обоснованный вывод.

Датамайнинг - это технология, которая состоит из этапов, которые объединяют несколько областей, но не следует путать с программным обеспечением.

В настоящее время существуют некоторые приложения или инструменты интеллектуального анализа данных, которые являются мощными и облегчают разработку проектов, хотя обычно они дополняются другим инструментом.

Этапы процесса анализа данных

Хотя интеллектуальный анализ данных имеет тенденцию отличаться друг от друга, общий процесс их состоит из четырех основных этапов:

Определение целей

Этот первый этап связан с определением целей, которые может пожелать клиент, под руководством специалиста по

майнингу данных.

Повторная обработка данных

На втором этапе это в основном относится к отбору, очистке, обогащению, сокращению и преобразованию баз данных, этот этап обычно занимает около семидесяти процентов от общего времени проекта сбора данных.

Определение модели

Третий этап, на этом начинается статистический анализ данных, а затем они визуализируются в графическом виде, чтобы иметь приближение.

В зависимости от поставленных целей и задач, которые предстоит выполнить, могут использоваться некоторые алгоритмы, разработанные в различных областях искусственного интеллекта.

Анализ результатов

Этапы проекта Datamining (Vallejos, 2006)

На последнем этапе полученные результаты проверяются и сравниваются со статистическим анализом и графиками.

Клиент должен решить, являются ли они новыми и предоставляют ли они новые знания, позволяющие им принимать решения.

Приложения использования

В течение каждого года на разных конгрессах и семинарах встречаются исследователи с разными приложениями, особенно в Соединенных Штатах, интеллектуальный анализ данных был включен в жизнь организаций, университетов, правительств, больниц и различных компаний, заинтересованных в изучении его баз. данных.

В правительстве

ФБР проанализирует коммерческие базы данных на предмет обнаружения террористов.

В компании

  • Он позволяет обнаруживать мошенничество с кредитными картами. Узнайте, почему люди уходят из компании мобильной связи. Выявление покупательских привычек в супермаркетах. Предсказание размера телеаудитории.

В колледже

Он позволяет узнать, занимаются ли недавние выпускники университета профессиональной деятельностью, связанной с тем, что они изучали.

В специальных расследованиях

Разработка проекта SKYCAT, основанного на методах группирования и деревьях решений, позволяющих классифицировать объекты с высокой надежностью.

В спортивных клубах

Команды НБА используют разумные приложения для поддержки своей тренерской команды. (Валлехос, 2006)

вывод

Датамайнинг или интеллектуальный анализ данных, как мы видели при разработке этой статьи, служит для развития лояльности клиентов, поскольку позволяет им предлагать то, что они считают ценным, поскольку одной из его характеристик является выявление моделей поведения с определенной тенденцией к отказу. Падение основано на данных тех клиентов, которые уже сделали это, поэтому организации всегда могут быть на шаг впереди и предложить некоторые стимулы для удержания своих клиентов.

Есть также много важных прикладных областей для этого типа анализа информации, таких как медицина, предотвращение и контроль мошенничества, расследование действий, связанных с терроризмом, инженерией и генетикой.

Люди, занимающиеся интеллектуальным анализом данных, говорят, что это в основном статистика, смешанная с бизнесом, и утверждают, что методы, которые он использует, и виды проблем, с которыми он может столкнуться, делают его уникальным и весьма актуальным.

Таким образом, интеллектуальный анализ данных представлен как технология, которая, разумеется, имеет ряд преимуществ, таких как место встречи исследователей и деловых людей, экономия больших сумм денег для организации, а также возможность открывать новые возможности для бизнеса. В дополнение к работе с датамайнингом подразумевается забота о стольких деталях, что в конечном итоге позволяет принимать точные решения.

Ссылки

  • Дуран Мена, К. (6 августа 2014 г.). Forbes Мексика. Получено с сайта https://www.forbes.com.mx/mineria-de-datos-informacion-precisa-y-relevante/Larrieta, MI, & Santillán Gómez, AM (2007). Электронный журнал UNAM. Получено в марте 2016 г. из Data Mining: концепция, характеристики, структура и приложения: http://www.ejournal.unam.mx/rca/190/RCA19007.pdfRAE. (2014). Королевская испанская академия. Получено с http://dle.rae.es/srv/search? M = 30 & w = разнообразный Sinnexus. (2007). Business Intelligence Стратегические вычисления. Получено в марте 2016 г. с: http://www.sinnexus.com/business_intelligence/datamining.aspxSQL Server. (2014). Microsoft. Получено из https://msdn.microsoft.com/esmx/library/ms174949(v=sql.120).aspx Информационные технологии. (2009). Информационные системы: обработка данных, планирование и управление ресурсами.Получено в марте 2016 г. с сайта http://www.tecnologias-informacion.com/mineria-de-datos.html Vallejos, SJ (2006). ExaUnne.edu. Получено в марте 2016 г. с

Пестрый: неоднородный, собран без сомнений. (RAE, 2014)

Скачать оригинальный файл

Сбор данных