Аналитик больших данных со статистикой

Бесплатно для тебя

с помощью продвижения

Сначала курс научит тебя статистике и позволит распознавать корреляции, проверять наблюдения и правильно классифицировать данные измерений. Также ты узнаешь о таких областях, как аналитика данных и инженерия данных, об использовании искусственного интеллекта (ИИ) в этой области и об управлении анализом данных в больших данных.
  • Тип степени: Сертификат "Статистика
    Сертификат "Аналитик больших данных"
  • Дополнительная квалификация: Сертификат "Data Engineer
    Сертификат "Аналитика данных
    Сертификат "Специалист по большим данным"
  • Итоговый экзамен: Практическая работа над проектом с итоговыми презентациями
  • Время уроков: Полный рабочий день
    С понедельника по пятницу с 8:30 до 15:35 (в праздничные дни с 8:30 до 17:10).
  • Язык обучения: Немецкий
  • Продолжительность: 16 Недели

Статистика

Основы статистики (около 6 дней)

Основы теории измерений (совокупность и выборка, типы выборок, уровни измерения и шкалы)

Одномерная описательная статистика (частотные распределения, центральные меры, меры дисперсии, стандартные значения, гистограммы, столбчатые диаграммы, круговые диаграммы, линейные диаграммы и коробчатые графики)

Двумерная описательная статистика (меры корреляции, коэффициенты корреляции, кросстабы, диаграммы рассеяния и сгруппированные гистограммы).

Основы индуктивной выводной статистики (распределение вероятностей, нормальное распределение, распределение средних значений, тест на значимость, проверка нулевой гипотезы Фишера, размер эффекта, оценка параметров, доверительные интервалы, графики ошибок, анализ мощности и определение оптимального размера выборки)


Искусственный интеллект (ИИ) в рабочем процессе

Презентация конкретных технологий ИИ

и возможного применения в профессиональной среде


Методы сравнения двух групп (около 5 дней)

z- и t-тест для выборки (отклонение от заданного значения)

t-тест для средней разницы между двумя независимыми/взаимосвязанными выборками

Проверка эффективности действий, мер, вмешательств и других изменений с помощью t-тестов (претест-посттест с двумя группами).

Вспомогательные тесты значимости (тест Андерсона-Дарлинга, тест Райана-Джойнера, тест Левене, тест Бонне, тест значимости для корреляций)

Непараметрические методы (тест Вилкоксона, тест знаков, тест Манна-Уитни)

Анализ случайностей (биномиальный тест, точный тест Фишера, тест хи-квадрат, кросс-табуляция с мерами ассоциации)


Методы сравнения средних показателей нескольких групп (около 5 дней)

Одно- и двухфакторный дисперсионный анализ (простой и сбалансированный ANOVA)

Многофакторный дисперсионный анализ (общая линейная модель)

Фиксированные, случайные, перекрестные и вложенные факторы

Методы множественных сравнений (Tukey-HSD, Dunnett, Hsu-MCB, Games-Howell)

Анализ взаимодействия (анализ эффектов взаимодействия)

Анализ избирательности и мощности для дисперсионного анализа


Введение в проектирование экспериментов (DoE) (около 1 дня)

Полные и частичные факториальные экспериментальные схемы


Работа над проектом (около 3 дней)

Закрепление изученного материала

Презентация результатов проекта

Инженер по обработке данных

Основы бизнес-аналитики (около 2 дней)

Области применения, аспекты архитектуры BI

Основы бизнес-аналитики, OLAP, OLTP, задачи инженеров по данным

Хранилище данных (DWH): обработка структурированных, полуструктурированных и неструктурированных данных


Управление требованиями (около 2 дней)

Задачи, цели и процедуры анализа требований

Моделирование данных, введение/моделирование с помощью ERM

Введение/моделирование в UML

- Диаграммы классов

- Анализ сценариев использования

- Диаграммы деятельности


Искусственный интеллект (ИИ) в рабочем процессе

Презентация конкретных технологий ИИ

и возможного применения в профессиональной среде


Базы данных (около 3 дней)

Основы систем баз данных

Архитектура систем управления базами данных

Применение РСУБД

Реализация модели данных в РСУБД, нормальные формы

Практическое и теоретическое введение в SQL

Пределы реляционных баз данных, csv, json


Хранилище данных (около 4 дней)

Звездная схема

Моделирование данных

Создание Star Schema в RDBMS

Схема "Снежинка", основы, моделирование данных

Создание схемы Snowflake Schema в RDBMS

Galaxy Schema: основы, моделирование данных

Медленное изменение таблиц размерностей типов 1-5 - перестроение, штабелирование, реорганизация, мини-размерность и тип 5

Введение в обычные, причинные, мини- и монструозные, гетерогенные и суб-измерения

Сравнение ориентации на состояние и на транзакции

Таблицы фактов DWH, плотность и хранение


ETL (около 4 дней)

Очистка данных

- Нулевые значения

- Подготовка данных

- Согласование данных

- Применение регулярных выражений

Понимание данных

- Проверка данных

- Статистический анализ данных

Защита данных, безопасность данных

Практическая структура ETL-маршрутов

Data Vault 2.0, основы, концентраторы, связи, спутники, хэш-ключ, хэш-диф.

Моделирование данных в Data Vault

Практическая структура модели Data Vault - Raw Vault, практическая реализация хэш-процедур


Работа над проектом (около 5 дней)

Закрепление изученного материала

Презентация результатов проекта

Аналитика данных

Введение в анализ данных (около 1 дня)

Эталонная модель CRISP-DM

Рабочие процессы анализа данных

Определение искусственного интеллекта, машинного обучения, глубокого обучения

Требования и роль в компании инженеров по данным, data scientist и data analysts


Обзор основ Python (около 1 дня)

типы данных

Функции


Анализ данных (около 3 дней)

Центральные модули Python в контексте аналитики данных (NumPy, Pandas)

Процесс подготовки данных

Алгоритмы интеллектуального анализа данных на Python


Искусственный интеллект (ИИ) в рабочем процессе

Презентация конкретных технологий ИИ

и возможного применения в профессиональной среде


Визуализация данных (около 3 дней)

Эксплоративный анализ данных

понимание

Качество данных

Анализ преимуществ

Визуализация с помощью Python: Matplotlib, Seaborn, Plotly Express

Рассказ о данных


Управление данными (около 2 дней)

Архитектуры больших данных

Реляционные базы данных и SQL

Сравнение баз данных SQL и NoSQL

Бизнес-аналитика

Защита данных в контексте анализа данных


Анализ данных в контексте больших данных (около 1 дня)

Подход MapReduce

Spark

NoSQL


Приборные панели (около 3 дней)

Библиотека: Dash

Структура приборных панелей - компоненты Dash

Настройка дашбордов

Обратные вызовы


Текстовый майнинг (около 1 дня)

Предварительная обработка данных

Визуализация

Библиотека: SpaCy


Работа над проектом (около 5 дней)

Закрепление изученного материала

Презентация результатов проекта

Специалист по большим данным

Что такое большие данные? (примерно 1 день)

Объем, скорость, разнообразие, ценность, достоверность

Возможности и риски больших объемов данных

Дифференциация: бизнес-аналитика, аналитика данных, наука о данных

Что такое добыча данных?


Введение в фреймворки Apache (около 2 дней)

Решения для работы с большими данными в облаке

Модели доступа к данным

Хранение данных


MapReduce (около 3 дней)

Философия MapReduce

Кластер Hadoop

Цепочка заданий MapReduce


Искусственный интеллект (ИИ) в рабочем процессе

Презентация конкретных технологий ИИ

и возможного применения в профессиональной среде


Компоненты (около 3 дней)

Краткая презентация различных инструментов

Передача данных

Приложения YARN

Hadoop JAVA API

Apache Spark


NoSQL и HBase (около 3 дней)

Теорема CAP

ACID и BASE

Типы баз данных

HBase


Визуализациябольших данных (около 3 дней)

Теории визуализации

Выбор диаграмм

Новые типы диаграмм

Инструменты для визуализации данных


Работа над проектом (около 5 дней)

Закрепление изученного материала

Презентация результатов проекта



Возможны изменения. Содержание курса регулярно обновляется.

Необходимы навыки программирования (в идеале Python) и опыт работы с базами данных (SQL).

Вы освоили процессы, связанные с объединением, подготовкой, обогащением и пересылкой данных, и понимаете, как анализировать большие данные, используя основы программирования на Python, концепции баз данных SQL и NoSQL. Знание отраслевого программного обеспечения для обработки и структурирования больших неструктурированных данных и их визуализации дополняет ваши знания.

Пройдя этот курс, вы будете понимать основы статистики, уметь обрабатывать и оценивать данные, а также представлять, объяснять и интерпретировать результаты статистического анализа и результаты с помощью графиков.

Курс рассчитан на людей с высшим образованием в области компьютерных наук, бизнес-информатики, делового администрирования, математики или сопоставимой квалификации.

Систематическая оценка объемов данных необходима компаниям для получения информации о собственной продукции и поведении клиентов. На этом фоне аналитики больших данных становятся все более востребованными во всех отраслях.

Хорошее знание статистики - ценная дополнительная квалификация, которая пользуется большим спросом в области промышленных исследований и разработок, в разработке лекарств, в контроле медицинских исследований, в сфере финансов и страхования, в информационных технологиях или в государственном управлении.

Ваш значимый сертификат дает подробное представление о приобретенных вами квалификациях и улучшает ваши карьерные перспективы.

Дидактическая концепция

Ваши преподаватели обладают высокой профессиональной и дидактической квалификацией и будут обучать вас с первого до последнего дня (никакой системы самообучения).

Вы будете учиться в эффективных небольших группах. Обычно курсы состоят из 6-25 человек. Общие занятия дополняются многочисленными практическими упражнениями во всех модулях курса. Практический этап - важная часть курса, поскольку именно в это время вы обрабатываете полученные знания и обретаете уверенность и практичность в их применении. Заключительный раздел курса включает в себя проект, разбор конкретных ситуаций или итоговый экзамен.

 

Виртуальный класс alfaview®

BildungszentrumЗанятия проводятся с использованием современной видеотехнологии alfaview® - не выходя из дома или в нашем офисе по адресу . Весь курс может видеть друг друга лицом к лицу через alfaview®, общаться друг с другом с помощью синхронизированного по губам голоса и работать над совместными проектами. Разумеется, вы также можете в любое время видеть и разговаривать со своими преподавателями в прямом эфире, и на протяжении всего курса вас будут обучать преподаватели в режиме реального времени. Уроки - это не электронное обучение, а настоящее живое очное преподавание с помощью видеотехнологий.

 

alfatraining Agentur für Arbeit Учебные курсы субсидируются и сертифицируются в соответствии с положением об утверждении AZAV. Bildungsgutschein Aktivierungs- und VermittlungsgutscheinПри подаче заявки или заявки на обучение все расходы на курс обычно покрываются финансирующей организацией.
Europäischen Sozialfonds Deutsche Rentenversicherung Финансирование также возможно через программы (ESF), (DRV) или региональные программы финансирования. Berufsförderungsdienst Как постоянный солдат, вы можете посещать курсы повышения квалификации по программе (BFD). Agentur für Arbeit (Qualifizierungschancengesetz) Компании также могут повысить квалификацию своих сотрудников по программе финансирования от .

Мы будем рады бесплатно проконсультировать тебя. 0800 3456-500 Пн - Пт с 8:00 до 17:00
бесплатно из всех немецких сетей.
Свяжитесь с нами
Мы будем рады бесплатно проконсультировать тебя. 0800 3456-500 Пн - Пт с 8:00 до 17:00 бесплатно из всех немецких сетей.