You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Guia do repositorio de algoritmos de machine Leaning:
01: Naive Bayes
-O algoritmo “Naive Bayes” é um classificador probabilístico baseado no “Teorema de Bayes”,
o qual foi criado por Thomas Bayes (1701 - 1761) para tentar provar a existência de Deus.
-A principal característica do algoritmo, e também o motivo de receber “naive” (ingênuo)
no nome, é que ele desconsidera completamente a correlação entre as variáveis (features).
-Usado bastante para identificar se um email é um spam utilizando da frequencia de palavras
nele contido.
02: Ávores de Decisão
-Árvores de decisão é um método de aprendizado de máquinas supervisionado não-paramétricos,
utilizado em tarefas de classificação e regressão.
-As ávore de de decisão são compostas por nós e folhas, os nós podem ser 'RAIZ' ou 'FILHO' que
guardão informação, o 'RAIZ' é aquele que possui o maior nivel hierárquico e é o primeiro nó
de decisão, ele pode ter nós filhos de nivel hierárquico mais baixo, os filhos por sua vez podem
ter outros filhos, e os nós que não possuem filhos são chamados de 'folhas' as folhas sinalizam
o final da ávore de decisão.
-Uma árvore armazena regras em seus nós que devem ser aplicadas aos dados, e os nós folhas
representam a decisão a ser tomada, no caso uma classificação.
-Uma árvore de decisão, uma decisão é tomada através do caminhamento a partir do nó raiz até o nó folha.
03: Random Florest
-Floresta Aleatória (random forest) é um algoritmo de aprendizagem supervisionada. Como você pode perceber
pelo seu nome, ele cria uma floresta de um modo aleatório. A “floresta” que ele cria é uma combinação (ensemble)
de árvores de decisão, na maioria dos casos treinados com o método de bagging. A idéia principal do método de
bagging é que a combinação dos modelos de aprendizado aumenta o resultado geral.
04: Aprendizagem por Regras
05: KNN - K-Nearest Neighbors
-KNN(K — Nearest Neighbors) é um dos muitos algoritmo usado no campo de machine learning, ele é um classificador
onde o aprendizado é baseado “no quão similar” é um dado (um vetor) do outro. O KNN usa o como base para encontar
a similaridade a distancia de cada dado não classificado, usando distâncias como Euclidiana, Manhattan, Minkowski
ou Ponderada, dos dados que já estão classificados.
06: Regressão Logística
-A Regressão Logística é uma regressão múltipla, mas com uma variável de saída categórica binária (dependente) e
variáveis preditivas (explicativas ou independentes) contínuas ou categóricas. Quando a variável dependente é
binária (como sim/não), não podemos usar a regressão linear. Optamos por isso por uma transformação logarítmica
e procedemos para a analisar o grau preditivo da(s) variável(is) independente(s).
-É uma das funções que possui a curva de forma “S” utilizada para a classificação binária. Converte valores para
o intervalo de 0, 1 que interpretou como uma probabilidade de ocorrer algum evento
07: SVM - Support Vector Machine
08: Neural_Network
09: Cross_Validation
10: Salvando_models
11: Combinacao_de_Models
12: Regressao_Linear
-O algoritmo de Regressão linear usará os pontos de dados para encontrar a melhor linha de ajuste para modelar os
dados. Uma linha pode ser representada pela equação, y = m * x + c onde y é a variável dependente e x é a variável
independente. As teorias básicas de cálculo são aplicadas para encontrar os valores para m e c usando o conjunto
de dados fornecido.
-A Regressão linear tem 2 tipos como Regressão linear simples, onde são utilizadas apenas 1 variável independente
e Regressão linearmúltipla, onde múltiplas variáveis independentes são definidas.
13: Regressao_Polinomial
14: Algoritmo_Apriori
15: K-means
-Este é um algoritmo sem supervisão que fornece uma solução para o problema de agrupamento. O algoritmo segue um
procedimento para formar clusters que contêm pontos de dados homogêneos.
-O valor de k é uma entrada para o algoritmo. Com base nisso, o algoritmo seleciona k número de centroides. Em seguida,
os pontos de dados vizinhos para um centróide se combinam com o centroide e criam um cluster. Mais tarde, um novo centróide
é criado dentro de cada cluster. Em seguida, os pontos de dados próximos ao novo centróide serão combinados novamente
para expandir o cluster. Esse processo é continuado até que os centroides não mudem.