Logo ru.artbmxmagazine.com

Большое количество данных. анализ больших объемов информации

Оглавление:

Anonim

В то время, когда мы живем, очень трудно представить себе дом кого-либо из наших знакомых, у которых нет доступа к Интернету, так как этот инструмент здесь, чтобы остаться, и это то, что мы хотим или нет, мы используем большие данные каждый день для различных мероприятий В свободное время, разговаривая с нашими родственниками, которые живут далеко от нас, для нашей работы или просто для поиска.

Со всеми этими действиями, которые мы проводим, формируется внушительный объем данных, который имеет первостепенное значение для организаций, так как они знают, что происходит в настоящее время, в отношении интересов потребителей или как выйти на различные рынки, с Это может сделать прогноз того, что произойдет в будущем, трудно исправить все, что организации могут сделать с этой информацией.

В прошлом было невозможно думать, что организации могут сделать все вышеперечисленное, потому что, хотя компьютеры уже были доступны для них, они еще не были достаточно мощными. Но с развитием технологий это стало реальностью, и нужно поблагодарить большие данные, которые являются главной концепцией, на которой будет основана эта статья, чтобы понять всю мощь и масштабы, которые она имеет для организаций, поскольку Это значительно повысило конкурентоспособность и является определяющим фактором для принятия решений.

Как упоминалось выше, объем генерируемых данных ужасен, что усложняет их обработку. Но компании нуждаются в этих данных практически в реальном времени, и именно здесь большие данные будут ключом.

Ключевые идеи.

Некоторые ключевые понятия упомянуты ниже, чтобы читатель мог лучше понять статью.

«Это символическое представление (среди прочего, числовое, алфавитное, алгоритмическое, пространственное) атрибута или переменной, которые являются количественными или качественными. Данные описывают эмпирические факты, события и институты. Это значение или ссылка, которую компьютер получает различными способами, данные представляют собой информацию, которой программист манипулирует при построении решения или при разработке алгоритма ». (Википедия, 2018)

«Это совокупность знаний, с помощью которых человек развивает лучшую, более здоровую, более приятную и прежде всего комфортную среду для оптимизации жизни». (Definista, 2011)

Большое количество данных

«Набор данных или комбинации наборов данных, чей размер (объем), сложность (изменчивость) и скорость роста (скорость) затрудняют их сбор, управление, обработку или анализ с использованием традиционных технологий и инструментов, таких как статистические и реляционные базы данных обычные или визуализированные пакеты, в течение необходимого времени, чтобы быть полезным. " (PowerData, 2018).

Происхождение больших данных

С тех пор, как была изобретена письменность, человек хранил информацию разного рода, она не изменилась, так как в настоящее время с современными системами сбора данных она стала повседневной, но очень важной процедурой.

По оценкам данных, в течение следующего десятилетия будет около 40 зетабайт информации, генерируемой по всему миру, что эквивалентно умножению каждой песчинки в пятьдесят семь раз с каждого побережья мира.

Ниже приведены некоторые события, которые вместе с появлением Интернета породили то, что мы теперь знаем как Большие данные, согласно Ciampagna (2015), наиболее представительными являются следующие:

  • o Стоимость накопления цифровой информации резко падает, поэтому теперь этот способ обходится дешевле, чем ее накопление на бумаге. o Google запускает поисковую систему для информации, которая вскоре станет самой популярной в мире.
    • Михаэль Леск прогнозирует, что скорость роста цифровой информации будет составлять десять раз в год.
  • Термин «большие данные» впервые используется в исследовательской работе под названием «Визуальное исследование наборов гигабайтных данных в режиме реального времени».
  • Web 2.0 создается, веб-страница, на которой пользователи создают свою собственную информацию. Создание Hadoop, который представляет собой сайт со средой больших данных и является абсолютно бесплатным для пользователей.
  • Сотовые телефоны впервые используют Интернет на компьютерах, что приводит к постоянному соединению и увеличению трафика данных. Опрос, проведенный среди руководителей из разных частей света, показал, что 88% респондентов этот БОЛЬШОЙ анализ данных имеет первостепенное значение для ваших организаций.

Эти данные содержатся в сканерах сетчатки глаза, отпечатках пальцев или более сложных считывателях ДНК. Этот тип технологии связан с мерами безопасности, но в конечном итоге станет данными, которые будут полезны для организаций. поскольку они могут быть элементами безопасности общества.

Преобразование данных

Поскольку организации собирают данные (всеми способами, описанными в предыдущем пункте), их будет слишком много, что, возможно, из-за того, что они разбросаны, не сильно коррелирует с остальными. Так что теперь продолжайте собирать их вместе в одном пространстве и иметь одинаковый стиль.

В эту часть процесса войдут системы извлечения, преобразования и загрузки (ETL), что его целью будет устранение ненужных данных, сгруппировать те, которые важны, чтобы дать им тот же формат, и загрузить их в базу данных, созданную организацией.

Инструменты больших данных

Сегодня, согласно Институту инженерии знаний (2016), мы можем найти различные инструменты, которые помогают нам разрабатывать большие данные. Вот некоторые примеры наиболее часто используемых инструментов:

Hadoop.

Hadoop является наиболее важным инструментом для работы с большими данными, он бесплатен в использовании и считается стандартной рабочей средой для хранения, хотя он также анализирует и обрабатывает большие объемы данных, он используется глобальными организациями, такими как Facebook и Yahoo!

Elasticsearch.

Это мощный инструмент для поиска больших объемов сложных данных.

Это дает нам возможность анализировать большое количество данных в любое время и обращаться к ним. Его можно использовать для полнотекстового поиска, поскольку данные, упорядоченные по критерию, получают данные очень быстро.

«С Elasticsearch мы можем выполнять сложный текстовый поиск, визуализировать состояние наших узлов и масштабировать без особых потребностей, если бы в этом случае нам требовалось больше энергии». (Институт инженерии знаний, 2016)

Apache Storm.

Этот инструмент предназначен для работы в данный момент и предназначен для постоянной обработки данных. Примером могут служить те, которые поступают из социальных сетей, огромный объем данных (по оценкам, около 700 тысяч единиц контента передаются каждую минуту в Facebook).

Анализ данных

Существуют различные методы, в которых организации полагаются на анализ огромного количества данных, которые они имеют, наиболее признанными являются следующие:

Ассоциация.

С помощью этой техники вы можете найти данные, которые связаны их различными переменными. Намерение состоит в том, чтобы найти прогноз того, что происходит с другими переменными.

Примером может служить возможность продавать клиентам товары, аналогичные тем, которые они потребляют, посредством электронных продаж.

Сбор данных.

Набор методов, которые корректируют статистические методы, с хранением в базах данных. Интеллектуальный анализ данных связан с другими инструментами, которые стремятся найти шаблоны в значительных объемах данных.

Группа.

То, что вы ищете, - это инструмент такого типа, который из огромного количества генерируемых данных делит его на более мелкие разделы, чтобы обнаружить сходство между этими данными и узнать условия, которые их указывают.

Чрезвычайно важно найти сходство между результатами и провести предварительную оценку данных, которые будут проанализированы.

Анализ текста.

Поскольку большинство данных, сгенерированных пользователями, представляют собой тексты, такие как электронная почта, поиски в Интернете и другие. Этот процесс стремится удалить информацию из этих данных, чтобы смоделировать различные темы или предсказать будущие поиски пользователями.

Наконец, как мы можем визуализировать данные?

Поскольку у нас есть конечный результат, после сбора, обработки и анализа этого огромного объема данных, мы должны найти способ, которым он может быть представлен конечному пользователю.

Различные исследования утверждают, что конечный пользователь предпочитает презентацию с хорошей структурой со сравнительными графиками, показывающими результаты вместо таблицы с большим количеством цифр и простыми выводами.

Примером того, как это можно представить, является платформа Мондриана, «это платформа, которая позволяет просматривать информацию посредством анализа данных, которые мы имеем. Эта платформа пытается охватить более конкретную аудиторию и более ограниченную полезность как интегральная система показателей организации ». (Википедия, 2018)

Также инфографика они стали модными, когда дело доходит до представления результатов, полученных в результате анализа данных, поскольку это визуально интересный, живой и простой материал для массового приема.

Пример недавно созданного инструмента Vodafone

В Испании, в частности в городе Барселоне, во время мероприятия Mobile World Congress компания Vodafone представила МСП в стране инструмент, позволяющий использовать преимущества больших данных, чтобы они могли знать и использовать данные, полученные от потребителей Vodafone, и это служить им для будущих решений об их бизнесе.

Vodafone заявляет, что данные будут полностью анонимными, и данные будут об их поведении, таких как: места, куда они ходили, сколько времени они там проводят, продолжительность звонков, посещаемые ими интернет-страницы, что они покупают мобильные приложения, которые устанавливают, среди прочего.

91% населения Испании имеет доступ к Интернету через мобильный телефон.

МСП, которые нанимают инструмент «Большие данные» под названием «Vodafone Analytics», должны будут платить ежемесячную подписку, чтобы получить доступ ко всем этим данным.

Эта привилегированная информация позволит принимать более взвешенные решения о том, сколько акций им необходимо иметь для определенного продукта, посмотреть, возможно ли открыть новые филиалы и в каких местах рекламные кампании сосредоточены, в частности, на определенных секторах.

Аналогичным образом, Vodafone указывает, что он будет направлен не только на МСП в стране, но и на то, что государственные учреждения могут подписаться, чтобы принимать решения о городском планировании, использовании общественного транспорта, среди различных вопросов, важных для общества.

Будет два варианта его коммерциализации: один будет напрямую связан с потребностями организации, а другой размещает информацию по модулям и будет стоить около 1000 или 1500 евро в месяц.

Важность больших данных

На протяжении всего чтения можно было прочитать или сделать вывод о различных преимуществах, которые означают, что организации должны иметь в своих руках все, что предлагает большие данные, но, будучи немного более конкретными, согласно PowerData (2018), это было бы некоторыми преимуществами для различные ситуации, с которыми сталкиваются организации всех видов.

Туризм.

То, что клиент счастлив и рад своему пребыванию, является ключом к успеху для организации, которая работает в этой области, но степень самоуспокоенности не всегда легко определить количественно, особенно когда организация этого хочет.

Использование больших данных дает этим организациям возможность анализировать данные, предоставленные их клиентами, анализировать их и выносить суждения о конкретной ситуации, поэтому, возможно, избегайте проблем, пока не стало слишком поздно.

Здоровье.

В организациях, ориентированных на здоровье клиентов, Big Data может многое предложить. Медицинские карты, планы медицинского страхования, приобретенная страховка и многие другие виды деятельности могут быть трудны для контроля, поскольку они полны информации, имеющей огромное значение для организации.

Именно туда входят большие данные, где они точно и быстро проанализируют всю хранимую информацию, и можно будет своевременно выносить суждения о диагностике или лечении пациента.

Администрация.

Сегодня перед администрацией стоит сложная задача: сохранить или даже улучшить качество и производительность, но с ограниченным бюджетом. С помощью Больших Данных операции увеличиваются, и администрация получает расширенное представление обо всех действиях, выполняемых в организации.

Розничная торговля. 5

Как торгуются продукты, в последние годы продвинулись вперед, так как потребители теперь ожидают, что ритейлеры будут знать, что они хотят и когда они этого хотят.

Большие данные - отличная поддержка для людей, которые занимаются этим типом бизнеса, поскольку теперь у них есть значительный объем информации о том, что на самом деле хочет клиент, каковы его покупательские привычки, знает бренды или продукты которому клиент верен, между прочим. они могут

5 Концепция часто связана с продажей в больших количествах, но с разными покупателями. (Порт, 2014)

прогнозировать, какие продукты будут пользоваться популярностью у потребителей, или рекомендовать продукты разных видов.

Увеличение смартфонов или другой периферии, которые имеют GPSПредоставляет организациям возможность направлять рекламу клиентам, когда они находятся рядом с определенным заведением. Это увеличивает прибыль организаций, предоставляющих услуги, и дает возможность привлечения новых потребителей.

Тезисное предложение.

Внедрение больших данных в МСП в городе Орисаба для улучшения рекламы.

Задача.

Знать, что ищут потребители, чтобы МСП могли проводить рекламные акции, рекламировать свою продукцию, в том числе для повышения своей рекламы.

Спасибо.

Я благодарю мою семью за то, что она предоставила мне всю поддержку и побуждение продолжать день за днем, Технологическому институту Орисабы за то, что он открыл мне свои двери и позволил мне продолжить обучение у магистра по административной инженерии и доктора Фернандо Агирре и

Эрнандеса за то, что он мотивировал меня своими знаниями на семинаре по основам административной инженерии для выполнения каждой из назначенных статей.

Вывод.

Прочитав эту статью, мы смогли осознать, что большие данные - это относительно новый инструмент, но ни для чего в мире он не будет временным, поскольку с большим потоком данных, который мы имеем сегодня, он все больше просил некоторую методологию, которая позволяет нам большие данные.

Большие данные являются частью механизма изменений в управлении организациями и даже обществами. Поэтому я думаю, что это установит основы того, что будет другим типом эволюции для человека.

Библиография.

Чампанья, JM (4 марта 2015 г.). Блог профессора Хосе. Получено с

Определенная. (23 августа 2011 г.) Определение понятия. Получено с http: //concepcióndefinicion.de/tecnologia/

IGN Group. (2 мая 2017 г.) Решения IGN Group Management для малых и средних предприятий. Получено с

Институт инженерии знаний. (13 октября 2016 г.) ИИК Институт инженерии знаний. Получено от «http://www.iic.uam.es/innovacion/her tools-big-data-para-empresa /»

Мартенес, В. (27 февраля 2018 г.). Vodafone запускает инструмент «больших данных» для малых и средних предприятий, чтобы лучше узнать своих клиентов. Мир.

PowerData. (2018). Специалисты по управлению данными PowerData. Получено с

Wikipedia. (20 февраля 2018 г.) Википедия, свободная энциклопедия. Получено с

Wikipedia. (27 февраля 2018 г.) Википедия, свободная энциклопедия. Получено с

_________

Зетабайт - это единица хранения информации, символом которой является ZB, он эквивалентен 1021 байту. (Википедия, 2018)

Эл. адрес.

Это процесс, который позволяет организациям перемещать данные из нескольких источников, переформатировать и очищать их, а также загружать их в другую базу данных для анализа или в другую операционную систему для поддержки бизнес-процесса. (Википедия, 2018)

Это сочетание синтетических, пояснительных и простых для понимания изображений и текстов для визуальной передачи информации и облегчения ее передачи. (Ofifacil, 2018)

Спутниковая система навигации.

Большое количество данных. анализ больших объемов информации