Entradas

K-Means

Imagen
K-MEANS (Aprendizaje No supervisado) El aprendizaje no supervisado, también conocido como machine learning no supervisado, utiliza algoritmos de machine learning para analizar y agrupar en clústeres conjuntos de datos sin etiquetar. Estos algoritmos descubren agrupaciones de datos o patrones ocultos sin necesidad de ninguna intervención humana. K-means es un algoritmo de clasificación no supervisada (clusterización) que agrupa objetos en k grupos basándose en sus características. El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide de su grupo o cluster. Se suele usar la distancia cuadrática. EJEMPLO # Importar las bibliotecas necesarias import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.preprocessing import StandardScaler # Crear un conjunto de datos de ejemplo data = {     'Años_Experiencia' : np.random.randint( 1 , 20 , 100 ),     'Nivel_Educativo' :

Naive Bayes

Imagen
NAIVE BAYES (Aprendizaje supervisado) En un sentido amplio, los modelos de Naive Bayes son una clase especial de algoritmos de clasificación de Aprendizaje Automático, o Machine Learning, tal y como nos referiremos de ahora en adelante. Se basan en una técnica de clasificación estadística llamada “teorema de Bayes”. Naïve Bayes o el Ingenuo Bayes es uno de los algoritmos más simples y poderosos para la clasificación basado en el Teorema de Bayes con una suposición de independencia entre los predictores. Naive Bayes es fácil de construir y particularmente útil para conjuntos de datos muy grandes. EJEMPLO # Importar las bibliotecas necesarias import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.naive_bayes import GaussianNB from sklearn.metrics import accuracy_score, confusion_matrix, classification_report # Crear un conjunto de datos de ejemplo data = {     'Años_Experiencia' : np.ran

Árbol de decisión

Imagen
ÁRBOL DE DECISIÓN  (Aprendizaje supervisado) Los árboles de decisión son un algoritmo de aprendizaje automático que se utiliza en la ciencia de datos para procesar grandes volúmenes datos y solventar problemas. Un diagrama de árbol de decisiones te permite evaluar mediante una representación gráfica los posibles resultados, costos y consecuencias de una decisión compleja. Este método es muy útil para analizar datos cuantitativos y tomar una decisión basada en números EJEMPLO # Importar las bibliotecas necesarias import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score, confusion_matrix, classification_report from sklearn.tree import export_text # Crear un conjunto de datos de ejemplo data = {     'Años_Experiencia' : np.random.randint( 1 , 20 , 100 ),     'Nivel_Educativo' : np.random.randint( 10 , 20

Regresión logística

Imagen
REGRESIÓN LOGÍSTICA  (Aprendizaje supervisado) Otro modelo de predicción de aprendizaje supervisado es el de regresión logística. Se trata de un tipo de análisis de regresión utilizado para predecir el resultado de una variable categórica (aquella que puede adoptar un número limitado de categorías) en función de las variables predictoras. EJEMPLO # Importar las bibliotecas necesarias import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, confusion_matrix, classification_report # Crear un conjunto de datos de ejemplo data = {     'Años_Experiencia' : np.random.randint( 1 , 20 , 100 ),     'Nivel_Educativo' : np.random.randint( 10 , 20 , 100 ),     'Edad' : np.random.randint( 20 , 60 , 100 ),     'Abandono' : np.random.choice([ 0 , 1 ], size= 100 ) } df = pd.DataFrame(data) # Dividi

Regresión lineal

Imagen
REGRESIÓN LÍNEAL  (Aprendizaje supervisado) La regresión lineal se utiliza para identificar la relación entre una variable dependiente y una o más variables independientes, y normalmente se aprovecha para hacer predicciones sobre resultados futuros. Cuando solo hay una variable independiente y una variable dependiente, se conoce como regresión lineal simple. EJEMPLO # Importar las bibliotecas necesarias import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error # Crear un conjunto de datos de ejemplo data = {     'Años_Experiencia' : np.random.randint( 1 , 20 , 100 ),     'Nivel_Educativo' : np.random.randint( 10 , 20 , 100 ),     'Edad' : np.random.randint( 20 , 60 , 100 ),     'Salario' : np.random.randint( 30000 , 80000 , 100 ) } df = pd.DataFrame(data) # Dividir los datos en conj

Aprendizaje Supervisado y No Supervisado

Imagen
DIFERENCIA ENTRE APRENDIZAJE SUPERVISADO Y NO SUPERVISADO Aprendizaje Supervisado: Es como enseñar a un modelo con ejemplos etiquetados, donde ya conocemos las respuestas correctas. Le decimos al modelo qué es lo que queremos que aprenda. Aprendizaje No Supervisado: Es como dejar que el modelo explore por sí mismo. No le decimos explícitamente qué buscar ni le proporcionamos respuestas predefinidas. El modelo debe descubrir patrones o estructuras por su cuenta. APLICACIONES DEL APRENDIZAJE SUPERVISADO El aprendizaje supervisado está enfocado en la vigilancia sobre los proyectos; la máquina será impregnada de conocimientos distintos que resultarán en datos de salida específicos. Por lo tanto, las aplicaciones deberán seguir este camino. Algunas de las aplicaciones son: Diagnóstico médico: para esta aplicación se utilizan imágenes médicas y datos etiquetados anteriormente para relacionarlas con etiquetas de enfermedades. Detección de spam: para esta aplicación, los algoritmos clasifica

Introducción al Aprendizaje Automático

Imagen
DEFINICIÓN El aprendizaje automático (también conocido como machine learning en inglés) es un subcampo de la inteligencia artificial (IA) que se ocupa del desarrollo de algoritmos y modelos que permiten a las computadoras aprender a realizar tareas sin ser programadas explícitamente para cada tarea específica. En lugar de seguir instrucciones programadas, los modelos de aprendizaje automático pueden mejorar su rendimiento a medida que se les proporciona más información y datos. APRENDIZAJE SUPERVISADO Y NO SUPERVISADO El aprendizaje supervisado y no supervisado son dos enfoques principales en el campo de la inteligencia artificial (IA) a) Aprendizaje Supervisado: Definición: En el aprendizaje supervisado, el algoritmo se entrena utilizando un conjunto de datos etiquetado, donde cada ejemplo en el conjunto de datos tiene una etiqueta o resultado conocido. Es decir, se proporciona al modelo un conjunto de ejemplos de entrada junto con sus correspondientes salidas deseadas. Objetivo: El