Корисний карантин: книги і курси з open data, data science та data visualization

  • 3 апреля, 15:01
  • 3847
  • 0

Карантин попри всі негативні моменти, які з ним пов'язані, визначає і позитивні моменти. Так, багатьом громадянам ця ситуація дозволила подумати про дистанційне навчання, або навіть отримати додаткову освіту у такий спосіб. Ная Новак, Head of PR & Communications 1991 Open Data Incubator, поділилась багатьма корисними онлайн-ресурсами та літературою, які допоможуть зайняти себе під час ізоляції з користю.

Дистанційне навчання з початком карантину стало особливо затребуваними. За інформацією Google Trends, популярність запитів на кшталт e-learning, MOOC, online course у всьому світі зросла на 100%, 200%, а для деяких – на 400% (порівняно з березнем минулого року).

Для тих, хто хотів би у самоізоляції отримати чи покращити навички роботи з даними, організатори національного конкурсу стартапів на основі відкритих даних Open Data Challenge зібрали добірку онлайн-курсів та книг від фахівців та амбасадорів відкритих даних, data science, machine learning, візуалізації даних.

Корисний карантин: книги і курси з open data, data science та data visualization

Open Data: базові принципи і практичні навички. 

Катерина Оніліогва, керівниця напряму відкритих даних USAID/UK аid проєкту «Прозорість та підзвітність у державному регулюванні та послугах / TAPAS» пропонує добірку онлайн-курсів.

Англійською:

  1. Розділ eLearning на Європейському порталі даних. Там 16 модулів, вони всі корисні, та мені найбільше подобаються про формати і пов’язані дані (linked data).
  2. Using Open Data for Digital Business від британської школи дистанційного навчання FutureLearn, особливо рекомендую бізнесу і стартапам. Курс дає розуміння, як дані можуть допомогти в трансформації бізнесу. 
  3. 11-модульний Finding Stories in Data від Open Data Institute. Адже вміти аналізувати дані – це лише перший крок, важливо їх правильно представляти, щоб вони мали найкращий ефект в ухвалені рішень, донесенні повідомлень тощо.  
  4. Курс про відкриті дані для розпорядників та користувачів від Світового Банку – Open Data Online Learning for Producers, Users, and Policymakers. Ґрунтовна теорія та найкращі світові практики. А ще після завершення навчання можна пройти тест та отримати сертифікат.

Українською:

  1. Курс по роботі з відкритими даними, розроблений за підтримки проєкту USAID/UK аid TAPAS і розміщений на Єдиному державному порталі відкритих даних. Це п’ять модулів про відкриті дані, їх цінність, якість і сталість.
  2. Цикл «Аналіз даних» на Prometheus: «Аналіз даних та статистичне виведення на мові R», «Машинне навчання», «Обробка та аналіз великих даних», «Візуалізація даних». 

Якщо ви лише починаєте знайомитись з поняттям відкритих даних або хочете зацікавити ним колег, далеких від Data Science, рекомендую плейліст на YouТube, який ми збирали з колегами з інкубатора. Інформація там подається дуже зрозумілою мовою, проте знадобиться англійська.

  1. Отримати перші навички роботи з даними допоможе посібник «Відкриті дані: формати і правила створення», який готувала команда Texty.org.ua у рамках проєкту USAID/UK аid «Прозорість та підзвітність у державному управлінні та послугах / TAPAS».
  2. Ще один плейліст, що надихає, – підбірка TED-виступів про те, як відкриті дані змінюють світ довкола. Тут вже можна подивитись не лише на основи, а й на конкретні практичні приклади.

Візуалізація даних

Продовжуючи тему візуального представлення даних: тим, хто хоче отримати чи розвинути навички візуалізації, автор блогу Textura.in.ua, викладач візуалізації даних факультету прикладних наук УКУ Андрій Газін рекомендує три книги: 

  1. Data Points by Nathan Yau Нейтан Яу – автор блогу Flowing Data та двох книжок про візуалізацію даних: Visualize This та Data Points. Я би радив починати з Data Points. Ця книга дає дуже хороший і структурований вступ до візуалізації даних. Тут розглядаються всі етапи її створення – від аналізу даних до презентації їх у вигляді статистичних графіків для конкретної аудиторії. Багато уваги також приділяється коректній інтерпретації даних.
  2. Making Data Visual by Miriah Meyer & Danyel Fischer Ця книга розглядає створення візуалізації як процес пошуку відповідей на питання. Тут практично немає технічних деталей, але добре викладена логіка постановки питання до даних та переходу від цих питань до візуалізацій. У книзі є кілька case-study, на прикладі котрих можна зрозуміти, які рішення впливають на вибір методу презентації даних.
  3. Fundamentals of Data Visualization by Claus Wilke Клаус Вілке – один з контрибуторів популярної бібліотеки для візуалізації даних ggplot2, але його книга language & tool agnostic, тобто не прив’язана до жодного конкретного інструменту. Тут детально описані всі етапи створення візуалізації, всі проблеми, які вам можуть трапитись у процесі, всі нюанси, на котрі потрібно звертати увагу.

Data Science, Deep Learning, AI

Head of Consulting Data Science UA Вероніка Тамайо Флорес ділиться трьома книгами, які варто почитати усім, хто хоче працювати у цій галузі:

AI Superpowers by Kai-Fu Lee.

Дуже авторитетний автор, хороший переклад (Вероніка говорить про переклад російською, «Сверхдержавы искусственного интеллекта». – Автор), кілька годин приємного читання. Підійде для всіх, хто хоче зрозуміти, що ж насправді відбувається у галузі ШІ, від людини «в темі». Рівень: новачок чи зацікавлений.

Doing Data Science. Straight Talk from the Frontline by Cathy O'Neil, Rachel Schutt.

Хоча книга й була написана у 2013 році, вона дає гарне уявлення про розвиток аналітики та базові алгоритми машинного навчання. У ній є вставки коду на [мові програмування] R, які допомагають краще зрозуміти матеріал. У битві Python vs. R я на боці останніх, тож мені ця книжка гріє серце. Прибічникам іншого табору книгу все одно раджу почитати для розуміння основ. Рівень: новачок.

«Глубокое обучение. Погружение в мир нейронных сетей», С. Николенко, А. Кадурин, Е. Архангельская.

Можливо, найкраща книга про нейронні мережі, написана російською. Ніколенко і колеги примудрились написати книгу про нейронки весело і цікаво. Продертись крізь неї без солідних знань у математиці буде важко. І навіть незважаючи на те, що з’явилось вже багато більш довершених архітектур, книжка все ще корисна для тих, хто тільки знайомиться зі світом глибокого навчання.

CEO DevRain, CTO ДонорUA і регіональний директор Microsoft Олександр Краковецький дав кілька корисних посилань для читачів, які хотіли б заглибитись у науку про дані:

  1. Towards Data Science – онлайн-ресурс про data science, machine та deep learning. Підійде широкій аудиторії, велика кількість матеріалів на різну тематику. Для мене це №1 ресурс з точки зору регулярного читання.
  2. Оскільки працюю з Microsoft-технологіями, то можу рекомендувати Applied AI – прикладний штучний інтелект (Microsoft AI School – Beginner – Applied AI). Там є Path Builder, який допоможе зорієнтуватись, що потрібно вивчати і в якій послідовності. Напрями: Conversational AI, AI Services, Machine Learning, Autonomous Systems, Responsible AI.

Книги для загального розвитку

  1. Naked Statistics: Stripping the Dread from the Data by Charles Wheelan («Гола статистика» Чарльза Вілана)
  2. Superintelligence: Paths, Dangers, Strategies by Nick Bostrom («Штучний інтелект» Ніка Бострома).
  3. Курс варто обирати залежно від цілей, рівня знань, бекґраунду. Є класичні курси від Andrew Ng на Coursera, є курси для підготовки до сертифікації (наприклад, Professional Certificate in Data Science Fundamentals на edX) тощо.

Director of Education навчального центру DEVrepublik Віта Селезньова додає до цих рекомендацій дві книги і два онлайн-курси. Її поради розраховані насамперед на рівень junior та junior+, але загалом будуть корисні всім: 

  1. Deep Learning by Ian Goodfellow
  2. Reinforcement Learning an Introduction by Richard Sutton and Andrew Barto
  3. Курс «Введение в машинное обучение» на Coursera
  4. Курс Machine Learning від уже згаданого Andrew Ng

Крім того, практично всі учасники цієї добірки та їхні компанії зараз, у період карантину, проводять онлайн-курси, вебінари та пропонують інші можливості дистанційного розвитку для аудиторії.

Джерело: mind.ua


0 комментариев
Сортировка:
Добавить комментарий