Несмотря на то, что преимущества больших данных безусловно привлекательны, важно отметить, что они часто сопровождаются набором проблем. Во-первых, большие данные сложно обрабатывать. Как мы уже упоминали, они объемные и быстрые, что означает, что для полезного использования в бизнесе требуются специальные инструменты. Однако правильные инструменты не так легко освоить, да и они не дешевы. Это означает, что бизнес должен быть готов к финансовым, человеческим и временным затратам на правильную интеграцию больших данных в операционные процессы.
Кроме того, большие данные также характеризуются высокой изменчивостью. Они могут представляться в виде фотографий или текстов, быть структурированными или неструктурированными. Изменчивость больших данных увеличивает их потенциальную ценность за счет расширения возможностей извлечения шаблонов, но также усложняет их обработку, аннотацию и обучение. Если вас интересует более подробная информация о проблемах, которые большие данные могут вызвать в бизнес-процессах, мы уже говорили об этом в нашей статье о больших данных и кризисе искусственного интеллекта.
Также стоит помнить, что существуют риски, связанные с неопределенностью больших данных. Поскольку становится сложнее предварительно обрабатывать поступающий поток данных, уровень уверенности в их достоверности резко снижается. Большие данные, которым нельзя доверять, бесполезны для обучения, а также вредны для автоматизированных алгоритмов машинного обучения, направленных на обработку данных и обучение моделей.
Тем не менее, сегодня утверждается, что самая серьезная проблема больших данных заключается не в их характеристиках, таких как разнообразие или неопределенность. 90,9% компаний, которые сделали первые шаги в принятии культуры больших данных, указывают на людей и процессы как основные препятствия для полноценного перехода к ориентации на данные. Навыки в области науки о данных не так легко получить, и людям требуется время для их понимания и мотивации к обучению. Кроме того, большие данные и искусственный интеллект все еще не имеют процедурной поддержки, необходимой для их широкого внедрения. Пока многие компании принимают ожидающее отношение, так как не могут позволить себе впечатляющие затраты на инвестиции в большие данные. Это все еще область с высоким риском и высокой наградой, требующая должного регулирования для того, чтобы стать недвусмысленно прибыльной.