Какие алгоритмы и структуры данных нужно освоить начинающему специалисту по Data Science

6 марта, 11:54 Работа 4303 3

Data Science — обширная сфера, поэтому начинающим специалистам может быть сложно понять, что им нужно изучать, интересно на какие алгоритмы и структуры данных нужно обратить внимание в первую очередь.

3 комментария
Сортировка:
Добавить комментарий
King Artur
King Artur 2020, 6 марта, 17:48
0
Также можно интересоваться, как обрабатываются различные данные в области, где хочется развиваться. Например, в рекомендательных системах и информационном поиске нужно хорошо знать алгоритмы на графах, в анализе изображений — как работают алгоритмы сжатия, поиска линий, смежных точек, а при анализе текста — поиск подстрок, регулярные выражения и т. д. Но повторюсь, хороший специалист должен иметь всеобъемлющее представление об алгоритмах и структурах данных.
Sania
Sania 2020, 6 марта, 15:24
0
Я бы посоветовал начать с общего обзора всех возможных направлений в машинном обучении: работа с текстом, изображениями, временными рядами, информацией о том, где и как применяется ML на практике и в научных исследованиях. Всегда полезно изучить классические алгоритмы: логистическая регрессия, например, используется с 60-х годов и даже не планирует устаревать. Отдельное внимание стоит уделить не самим алгоритмам, а методике их применения: проверке качества, детектировании переобучения, подготовке и очистке данных. И не старайтесь изучить сразу все возможные алгоритмы, лучше узнавать их по мере наработки навыка работы с данными. Практика показывает, что можно изучить всего один алгоритм и применять его всю жизнь, делая при этом очень крутые «штуки».
Vova P
Vova P 2020, 6 марта, 13:45
0
Лучше всего выбрать любой курс/учебник/лекции по алгоритмам и посмотреть содержание — это с большой вероятностью адекватный, проверенный временем необходимый список того, что нужно знать. Кроме того, любой курс включает понятия для анализа и понимания любых алгоритмов: вычислительная сложность по памяти, по времени, теории из анализа алгоритмов (почему сортировать быстрее, чем за O(N*logN), в среднем нельзя) — с этим в любом случае сталкиваешься при работе.

IT Новости

Смотреть все