Data mining :: синонимы

Jan 04, 2015 13:57

Иногда я провожу обзор научной литературы по применению продвинутых "алгоритмов" анализа данных. Термин "knowledge discovery from data" мне нравится больше чем "data mining", т.к. KDD явно описывает цель работы, тогда как DM предлагает название процессу; существуют и альтернативы, иногда специфичные для знаниевого домена. Для полноценного обзора ( Read more... )

Leave a comment

Comments 12

kovla January 5 2015, 13:33:08 UTC
Data science все же общее название подхода, полагающегося на синтез статистики и компьютерных наук, при этом с частым использованием big data. Я бы не стал ограничивать область применения интернетом, есть, например, астрономические или геологические данные. Достаточно взглянуть на соревнования на Kaggle, чтобы расширить домен data science до универсального.

Reply

dborisog January 5 2015, 13:42:46 UTC
http://jobs.aol.com/articles/2011/08/10/data-scientist-the-hottest-job-you-havent-heard-of/

> Data scientists are an integral part of competitive intelligence, a newly emerging field that encompasses a number of activities, such as data mining and analysis, that can help businesses gain a competitive edge.

Исходя из этой статьи data science является более универсальным термином, нежели data mining.

Пока исправил на универсальный домен.

Reply

dborisog January 5 2015, 13:50:39 UTC
http://en.wikipedia.org/wiki/Data_science#mediaviewer/File:Data_visualization_process_v1.png

Сразу вспоминается серия курсов https://www.coursera.org/specialization/jhudatascience/1?utm_medium=listingPage

https://github.com/jtleek/dataanalysis/blob/master/week1/007typesOfQuestions/index.md
И типы анализа данных из одного из этих курсов: Descriptive, Exploratory, Inferential, Predictive, Causal, Mechanistic

Reply


professorlabour January 5 2015, 14:11:18 UTC
Уточняя процесс вы ставите палки в колёса продажникам ;)

Reply


p2004r January 5 2015, 14:21:12 UTC
Возможно существует готовая онтолгия в формате SCOS. Если нет, то её давно пора составить :)

Reply

dborisog January 5 2015, 18:00:54 UTC
Возможно эта запись послужит толчком. Но мне кажется, что она будет полна и валидна только результатом совместной работы.

Reply

p2004r January 5 2015, 18:39:00 UTC
Точек роста довольно много...

Например вот с точки зрения UNESCO nomenclature for fields of science and technology.

http://skos.um.es/unesco6/1209/html

Reply


p2004r January 5 2015, 21:02:18 UTC
обычно вот сюда еще забывают смотреть http://cran.r-project.org/web/views/ судя по содержимому напоминает таблицу в топике

Reply

dborisog January 6 2015, 01:33:35 UTC
Спасибо, это интересный список, пусть оный и добавляет изрядную долю пестроты и цветосочетаний.

Reply


noocrat_dict January 17 2015, 22:39:19 UTC
Не понимаю, а почему просто это все не назвать словом "статистика ( ... )

Reply

p2004r February 5 2015, 07:39:10 UTC
library(igraph)

Reply

noocrat_dict February 5 2015, 18:32:41 UTC
Да спасибо, уже решил :) Тупанул я на "мостах кенинсберга". Ответ что то типа :

table(table(vector_domino)%%2) (если 1 больше 2 - построить нельзя)

нутро ж цепи домино все четные да и представлять ввиде граней графа изначально было б удобней - не запутался б. :(
З.Ы. библиотека конечно впечатляет. Все демки пересмотрел :)

Reply


Leave a comment

Up