Два аналитика из LinkedIn придумали термин «специалист по данным» в 2008 году. Они просто пытались описать то, что они делают, то есть извлекать пользу для бизнеса из массивных данных, генерируемых их веб-сайтами. В результате они назвали должность, которая будет пользоваться невероятным спросом в ближайшие годы и даже называться 'Самая сексуальная работа из 21 года'улвека. '
Теперь организации, которые рассматривают «данные» как ценный актив, ищут этих экспертов по данным или «ученых», которые поведут их в будущее.
Итак, что нужно, чтобы стать отличным специалистом по данным? ……… Разнообразные наборы навыков!
Кратко рассмотрим основные навыки специалиста по данным.
Процесс data science включает 3 этапа.
- Сбор данных
- Анализ данных
- Презентация
Давайте подробнее рассмотрим роль специалиста по данным на каждом из этих этапов.
Сбор данных
как использовать параметры в таблице
- Навыки программирования и баз данных
Первый шаг интеллектуального анализа данных - сбор правильных данных. Итак, чтобы быть специалистом по данным, очень важно быть знакомым с инструментами и технологиями, особенно с такими технологиями с открытым исходным кодом, как Hadoop, Java, Python, C ++ и технологиями баз данных, такими как SQL, NoSQL, HBase и т. Д.
- Бизнес-сфера и экспертиза
Данные различаются в зависимости от бизнеса. Следовательно, для понимания бизнес-данных необходим опыт, который приходит только при работе в определенной области данных.
Например: данные, собранные в области медицины, будут полностью отличаться от данных розничного магазина одежды.
десятичный в двоичный код Python
- Навыки моделирования, хранения и неструктурированных данных
Организации собирают огромное количество данных через различные ресурсы. Данные, полученные таким образом, неструктурированы, и их необходимо систематизировать перед анализом. Следовательно, специалист по анализу данных должен уметь моделировать неструктурированные данные.
Анализ данных
- Статистические инструменты
Важнейший навык специалиста по данным - это знать, как использовать статистические инструменты, такие как R, Excel, SAS и так далее. Эти инструменты необходимы для обработки собранных данных и их анализа.
- Математические навыки
Одних знаний в области компьютерных наук недостаточно, чтобы быть специалистом по данным. Профиль специалиста по данным требует того, чтобы кто-то мог разбираться в крупномасштабных алгоритмах и программировании машинного обучения, будучи опытным статистиком. Это требует опыта в других научных и математических дисциплинах, помимо компьютерных языков.
Презентация
каковы 6 способов использования этого ключевого слова?
- Навыки инструментов визуализации
Возможно, вы сможете добывать и моделировать собранные данные, но можете ли вы их визуализировать?
Если вы хотите стать успешным специалистом по анализу данных, вы должны уметь работать с некоторыми инструментами визуализации данных для визуального представления результатов анализа данных. Некоторые из них включают R, Flare, HighCharts, AmCharts, D3.js, Processing, API визуализации Google и т. Д.
Но это еще не конец! Если вы действительно хотите стать специалистом по анализу данных, вы также должны обладать следующими навыками:
- Навыки коммуникации: С статистикой и Excel справиться непросто. Специалисты по анализу данных должны уметь представлять данные таким образом, чтобы они передавали результаты бизнес-пользователям.
- Бизнес навыки : Специалистам по данным придется играть несколько ролей. Им нужно будет общаться с разными людьми в организации. Таким образом, наличие сильных деловых навыков, включая коммуникацию, планирование, организацию и управление, будет большим подспорьем. Это включает понимание требований бизнеса и приложений и соответствующую интерпретацию информации. Кроме того, он должен иметь общее представление о ключевых проблемах отрасли и должен знать финансовые коэффициенты для принятия более эффективных решений. Практический результат, специалист по анализу данных тоже должен думать о «бизнесе».
- Навыки решения проблем: Это кажется очевидным, поскольку наука о данных - это решение проблем. Эффективный специалист по данным должен найти время и глубоко изучить проблему и найти возможное решение, подходящее для пользователя.
- Навыки предсказания: Специалист по данным также должен быть эффективным предсказателем. Он должен хорошо разбираться в алгоритмах, чтобы выбрать тот, который правильно соответствует модели данных. Это требует определенного творческого подхода к использованию и разумному представлению данных.
- Взлом: Я знаю, это звучит пугающе, но различные хакерские навыки, такие как манипулирование текстовыми файлами в командной строке, понимание векторизованных операций и алгоритмическое мышление, сделают вас лучшим специалистом по анализу данных.
Глядя на вышеупомянутые наборы навыков, становится ясно, что специалист по данным - это не только знание всего о данных. Это профиль работы, в котором сочетаются навыки работы с данными, математические навыки, деловые навыки и коммуникативные навыки. Обладая всеми этими навыками вместе, Data Scientist по праву может быть назван рок-звездой ИТ-области.
Контрольный список, чтобы стать отличным и эффективным специалистом по данным:
Мы рассмотрели навыки, необходимые для того, чтобы стать специалистом по данным. Существует огромная разница в том, чтобы просто стать специалистом по данным и стать классным и эффективным специалистом по данным. Следующие навыки наряду с вышеупомянутыми навыками выделяют вас среди нормального или даже посредственного специалиста по обработке данных.
- Математические навыки - Расчеты, Матричные операции, Численная оптимизация, стохастические методы и т. Д.
- Статистические навыки - регрессионные модели, косы, классификации, диагностика, прикладная статистика и др.
- Общение - Визуализация, презентация и письмо.
- База данных - Помимо CouchDB, знание нетрадиционных баз данных, таких как MongoDB и Vertica.
- Языки программирования - Свинья, Улей, Java, Python и др.
- Обработка естественного языка и Сбор данных.
Эдурека имеет специально подобранный который поможет вам получить опыт в алгоритмах машинного обучения, таких как кластеризация K-средних, деревья решений, случайный лес, наивный байесовский анализ. Вы познакомитесь с концепциями статистики, временных рядов, интеллектуального анализа текста, а также познакомитесь с глубоким обучением. Новые партии для этого курса скоро начнутся !!