Аналіз великих наборів даних

DatabaseBooks3

Обычная цена ₴1,020.00

Сумма налога включена.
Книга "Аналіз великих наборів даних" написана провідними фахівцями в області технологій баз даних та інтернету. Завдяки популярності інтернет-торгівлі з'явилося багато надзвичайно об'ємних баз даних, для добування інформації з яких потрібно застосовувати методи видобутку даних (data mining) .В книзі описуються алгоритми, які реально використовувалися для вирішення найважливіших завдань видобутку даних і можуть бути з успіхом застосовані навіть до дуже великим наборам даних. Виклад починається з розгляду технології MapReduce - важливого засобу розпаралелювання алгоритмів. Викладаються алгоритми хешування з урахуванням близькості і потокової обробки даних, які надходять надто швидко для ретельного аналізу. У наступних розділах розглядається ідея показника PageRank, знаходження частих предметних наборів і кластерізація.Во друге видання включений додатковий матеріал про соціальні мережі, машинному навчанні і зниженні размерності.Оглавленіе книги Ульман Дж., Раджараман А., Лісковець Ю. "Аналіз великих наборів даних" Передмова ................................................. ................ 17О ніж ця книга .............................. .................................................. .............. 17Требованія до читача ................................. ................................................. 18Упражненія .................................................. ................................................. 18Поддержка в інтернеті ................................................ .......................................... 18Автоматізірованние домашні завдання ..... ................................................. 18Благодарності .................................................. ............ ................................ 19Глава 1.Добича даних ............. ................................................. 201.1 . Що таке видобуток даних? ............................................. ......................... 201.1.1. Статистичне моделювання ................................................ .......... 201.1.2. Машинне навчання ................................................ ............................ 211.1.3. Обчислювальні підходи до моделювання ....................................... 211.1.4. Узагальнення ................................................. ......................................... 221.1.5. Виділення ознак ................................................ .......................... 231.2. Статистичні межі видобутку даних .............................................. .. 231.2.1. Тотальне володіння інформацією ............................................... ....... 241.2.2. Принцип Бонферроні ................................................ .......................... 241.2.3. Приклад застосування принципу Бонферроні ........................................ 251.2.4. Вправи до розділу 1.2 .............................................. ...................... 261,3. Деякі корисні відомості ............................................. ................... 261.3.1. Важливість слів в документах .............................................. .................. 271.3.2. Хеш-функції ............................................... ........................................ 281.3.3. Індекси ................................................. .............................................. 291.3.4. Зовнішня пам'ять ................................................ ................................... 311.3.5. Підстава натуральних логарифмів ............................................... .... 311.3.6. Статечні залежності ................................................ ...................... 321.3.7. Вправи до розділу 1.3 .............................................. ...................... 341.4. План книги ................................................ .............................................. 351.5. Резюме ................................................. .................................................. 371.6. Список літератури................................................ ................................. 38Глава 2.MapReduce і новий програмний стек ......... ..................... 392.1. Розподілені файлові системи ............................................... ....... 402.1.1. Фізична організація обчислювальних вузлів ................................. 402.1.2. Організація великих файлових систем ............................................. 422.2 . MapReduce ................................................. ............................................ 422.2.1. Завдання-розподільники ............................................... ....................... 442.2.2. Угруповання по ключу ............................................... ........................... 442.2.3. Завдання-редуктори ............................................... ................................ 452.2.4. Комбінатори ................................................. ...................................... 452.2.5. Деталі виконання MapReduce ....................................