Сбор данных. используя технологии в наших интересах

ВВЕДЕНИЕ

(Riquelme, Ruiz, & Gilbert, 2006) утверждают, что цифровая революция сделала оцифрованную информацию простой для сбора, обработки, хранения, распространения и передачи. Благодаря значительному прогрессу в вычислительной технике и связанных с ними технологиях и расширению их использования в различных аспектах жизни, большой объем информации продолжает собираться и храниться в базах данных.

Поэтому важно, чтобы организации использовали этот тип технологий в своих интересах, чтобы противостоять существующим сегодня вызовам, таким как поддержание длительных отношений с клиентами. (Braga, Valencia, & Carvajal, 2009) заявляют, что самая большая проблема, с которой могут столкнуться организации сегодня, - это поддержание прибыльного клиентского портфеля, а не организация производства, сокращение затрат или оказываемое обслуживание, Хотя это необходимые условия, их уже недостаточно для победы на глобальном и высококонкурентном рынке.

Авторы предполагают, что именно благодаря знаниям, полученным о клиентах, организации должны иметь возможность интерпретировать свои цели, ожидания и желания. Этого можно достичь, утверждают они (Braga et al., 2009), с помощью «интеллектуального анализа данных» или «интеллектуального анализа данных, ориентированного на клиента», который представляет собой набор методов и методы, которые способствуют приобретению и удержанию той части рынка, которая подходит компании (рыночная доля). Цели хорошего ухода и снижения затрат также применимы к некоммерческим организациям, государственным или нет. Бизнес, который знает своих клиентов, будет обслуживать их еще лучше.

В этой статье будет объяснено, из чего состоит анализ данных, текста и настроений, и как организации могут использовать этот тип технологий не только для получения конкурентного преимущества перед другими организациями, но и для большей концентрации внимания на своих продуктах. и / или услуги информации, полученной от потребителей и клиентов.

СБОР ДАННЫХ

(Braga et al., 2009) объясняют, что интеллектуальный анализ данных обеспечивает автоматический метод обнаружения закономерностей в данных без предвзятости и ограничений анализа, основанного исключительно на человеческой интуиции.

Они также объясняют, что интеллектуальный анализ данных, ориентированный на клиентов, позволяет получить информацию о характеристиках и поведении клиентов. Потому что удержание клиентов обходится дешевле, чем привлечение новых.

Авторы объясняют, что интеллектуальный анализ данных включает набор методов для описания и прогнозирования больших массивов данных. По этой причине он обычно ассоциируется с базами данных, особенно называемыми «хранилищами данных». Эти базы данных позволяют быстро интегрировать данные из разных источников.

(Joyanes, 2016) утверждает, что интеллектуальный анализ данных относится к процессу поиска ценной бизнес-информации в базе данных, хранилище данных или витрине данных.

Интеллектуальный анализ данных может выполнять две основные операции:

Прогнозирование тенденций и поведения. Выявление ранее неизвестных закономерностей. Обычные приложения бизнес-аналитики обычно предоставляют пользователям представление о том, что произошло, интеллектуальный анализ данных помогает объяснить, что происходит, и предсказывает, что произойдет в будущем.

Интеллектуальный анализ данных - это процесс, в котором используются статистические, математические методы, методы искусственного интеллекта и машинного обучения для извлечения и выявления полезной информации, которая превращается в знания из больших баз данных, хранилища данных или витрины данных.

(Pérez, 2007) определяет интеллектуальный анализ данных как процесс обнаружения новых и важных взаимосвязей, закономерностей и тенденций путем изучения больших объемов данных.

(Riquelme et al., 2006) утверждает, что обнаружение знаний в базах данных (KDD) определяется как процесс выявления значимых закономерностей в данных, которые являются действительными, новыми, потенциально полезными и понятными для пользователя, и этот процесс Он интерактивный и итеративный, содержащий следующие шаги:

Понимание домена приложения: этот шаг включает соответствующие предварительные знания и цели приложения. Извлечение целевой базы данных: сбор данных, оценка качества данных и использование исследовательского анализа данных, чтобы ознакомиться с ними. Подготовить данные: включает очистку, преобразование, интеграцию и сокращение данных. Делается попытка улучшить качество данных при одновременном сокращении времени, необходимого для алгоритма обучения, применяемого впоследствии.Инструмент интеллектуального анализа данных: как отмечалось выше, это фундаментальная фаза процесса. Он состоит из одной или нескольких из следующих функций: классификации, регрессии, кластеризации, сводки, поиска изображений, извлечения правил и т. Д. Интерпретация: объяснение обнаруженных закономерностей, а также возможность их визуализации.Воспользуйтесь открытыми знаниями: воспользуйтесь созданной моделью

Поскольку мы смогли визуализировать фундаментальную фазу KDD - это интеллектуальный анализ данных, поэтому ниже мы объясним, из чего состоят его функции:

Классификация: классифицирует данные по предопределенным категориальным классам. Регрессия: цель этой модели - сопоставить данные с реальным значением переменной. Кластеризация: относится к группировке записей, наблюдений или наблюдений в классах объектов. Аналогичный. Кластер - это набор записей, которые похожи на записи другого кластера и отличаются от них. Генерация правил - здесь правила извлекаются или генерируются из данных. Эти правила относятся к обнаружению ассоциативных отношений и функциональных зависимостей между различными атрибутами. Резюме или резюмирование: эти модели обеспечивают компактное описание подмножества данных. Анализ последовательности: моделируются последовательные шаблоны, такие как анализ временных сущностей, последовательностей генов и др.Цель состоит в том, чтобы смоделировать состояния процесса или выделить и сообщить об отклонениях и тенденциях во времени.

ПРИЛОЖЕНИЯ ДЛЯ ДОБЫЧИ ДАННЫХ

(Riquelme et al., 2006) упоминает, что некоторые из важных задач интеллектуального анализа данных включают идентификацию приложений для существующих методов и разработку новых методов для традиционных или новых областей приложений, таких как электронная коммерция и биоинформатика.

Области, в которых может применяться интеллектуальный анализ данных, - это практически все виды деятельности человека, которые генерируют данные, такие как:

Торговля и банковское дело: сегментация клиентов, прогноз продаж, анализ рисков Медицина и фармацевтика: диагностика заболеваний и эффективность лечения Безопасность и обнаружение мошенничества: распознавание лиц, биометрическая идентификация, доступ к сетям запрещен и т. Д. Поиск нечисловой информации: интеллектуальный анализ текста, веб-интеллектуальный поиск, поиск изображений, видео, голоса и текста и идентификация из мультимедийных баз данных Астрономия: идентификация новых звезд и галактик Геология, горнодобывающая промышленность, сельское хозяйство и рыболовство: идентификация области использования для различных сельскохозяйственных культур, рыболовства или добычи полезных ископаемых в базах данных спутниковых изображений Науки об окружающей среде: определение функционирующих моделей естественных и / или искусственных экосистем для улучшения их наблюдения, управления и / или контроля Социальные науки:Изучение течений общественного мнения. Городское планирование: определение районов конфликта на основе социально-демографических ценностей.

ТЕКСТ МАЙНИНГ

(Matallana & Delgado, 2010) считают, что интеллектуальный анализ текста - это особая форма интеллектуального анализа данных, которая позволяет извлекать знания из больших информационных репозиториев, структурированных или нет, а также в форме текста. Цель аналогична задаче интеллектуального анализа данных, обнаруживая невидимые модели поведения и новые знания в документальной коллекции.

В интеллектуальном анализе текста используются математические и статистические методы, а также семантический анализ текста. Интеллектуальный анализ текста - это процесс применения автоматических методов для анализа и структурирования текстовых данных с целью получения полезных знаний из структурированной и неструктурированной информации.

По словам этих авторов, интеллектуальный анализ текста фокусируется на обнаружении интересных закономерностей и новых знаний в наборе текстов, его цель - обнаруживать новые тенденции, отклонения и ассоциации в больших объемах текстовой информации.

(Joyanes, 2016) объясняет, что интеллектуальный анализ текста ищет, добывает и обнаруживает текст в документах всех видов, это также называется интеллектуальным анализом текстовых данных, автор утверждает, что практический смысл - это процесс получения высококачественной информации из определенного текста.

Анализ текста пытается найти закономерности в наборе текстов, которые способствуют более эффективному принятию решений, его цель - улучшить процесс принятия решений. Текстовый анализ направлен на захват неструктурированных обработанных данных и создание из них структурированных данных, которые можно использовать в процессах анализа и отчетности.

(Joyanes, 2016) утверждает, что текстовые данные имеют большой потенциал воздействия почти на все организации и компании, а также в отрасли. Методы обучения, которые позволяют захватывать, анализировать и окончательный анализ текста, имеют решающее значение для организаций.

ЧУВСТВУЮЩАЯ ГОРНАЯ

(Joyanes, 2016) утверждает, что анализ настроений фокусируется на анализе чувств и мнений, представленных в текстовых сообщениях и других форматах мультимедиа, и позволяет обнаружить мнение или чувства, встроенные, например, в текстовые сообщения, в сообщениях Twitter и т. д. ощутимой выгоды для акционеров и работников, которые его составляют.

Известно, что анализ мнений или настроений относится к обработке естественного языка, компьютерной лингвистике и аналитике текста для выявления и извлечения субъективной информации из материальных источников.

Классический анализ настроений претерпел драматические изменения с момента появления Web 2.0 и увеличения использования блогов и социальных сетей. Веб-приложение, которое измеряет анализ настроений, называется «настроения в твиттере». Анализ настроений в настоящее время является популярным применением анализа текста, он изучает и получает общее направление мнений через большое количество людей, которые предоставляют информацию о том, что рынок говорит, думает и чувствует по поводу организация или человек. Анализ настроений использует данные с сайтов социальных сетей.

С точки зрения организации или компании, анализ настроений позволяет быстро и эффективно анализировать, что говорится о бренде или продукте, следить за мнениями или разговорами определенных влиятельных пользователей, выявлять тенденции в Интернете и т. Д.

(Joyanes, 2016) заявляет, что анализ настроений - это метод, который пытается преобразовать человеческие эмоции в данные, но с использованием современных инструментов можно добиться, чтобы спонтанность и непосредственность мнения в социальных сетях заставляли эти чувства становиться более аутентичны и сохраняют свое эмоциональное содержание. Анализ, связанный с неструктурированным контентом, можно оценить по следующим основным характеристикам:

Полярность: положительная, отрицательная или даже нейтральная по вашему мнению.

Интенсивность: степень выражаемой эмоции Субъективность: источник, излучающий выражение, является объективным, частичным или беспристрастным.

Анализ настроений может иметь разные приложения, такие как:

Измерение удовлетворенности сотрудников и рабочей среды Измерение удовлетворенности клиентов Предотвращение оттока клиентов путем выявления ситуаций риска потери клиента путем выявления негативных мнений, которые интерпретируются как возможный отказ от клиента. конкуренции, оценивая мнение о конкуренции бренда, компании, продуктов… и сравнивая его с нашим. Выявление сильных и слабых сторон в различных областях нашей организации путем выявления положительных или отрицательных мнений о влиянии. корпоративная репутация. Прогнозирование развития определенных действий, запусков продуктов и т. д. Анализ мнения электората в случае политических голосов.

Анализ тональности включает в себя обработку естественного языка (НЛП), искусственный интеллект и интеллектуальный анализ текста, среди других методов, поскольку он в основном стремится извлечь субъективную информацию из текста, такого как твит, сообщение в блоге., и т.д.

СПАСИБО

Я благодарю Бога за все его благословения, а также за возможность работать над самосовершенствованием. Я благодарю своих родителей за постоянную поддержку меня в этом новом приключении, Национальный совет по науке и технологиям за их поддержку в моей аспирантуре, Технологический институт Оризаба, степень магистра административной инженерии, а также предмет «Основы». административной инженерии, за то, что предоставили мне необходимые основы, чтобы стать лучше как профессионал и как человек.

СПРАВОЧНЫЕ МАТЕРИАЛЫ

Брага, LPV, Валенсия, IOL, и Карвахаль, SS (2009). Введение в интеллектуальный анализ данных. Рио-де-Жанейро: Электронные документы Editora, Джойанес, Лос-Анджелес (2016). Большие данные, Анализ больших объемов данных в организациях. Редактор Alfaomega Grupo, Маталлана, ИП, и Дельгадо, JMC (2010). От большого к малому: стратегии крупных корпораций, доступные для компаний среднего размера. Нетбибло. Перес, CL (2007). Интеллектуальный анализ данных: методы и инструменты. От редакции Paraninfo.Riquelme, JC, Ruiz, R., & Gilbert, K. (2006). Data Mining: концепции и тенденции. Искуственный интеллект. Иберо-американский журнал искусственного интеллекта, 10 (29). Восстановлено с

Скачать оригинальный файл