Indice
He aquí una lista de Los mejores programas gratuitos de minería de datos para Windows. Este software se utiliza para realizar diversas operaciones de minería de datos con el fin de extraer información útil de los conjuntos de datos. Los formatos de archivo compatibles para importar conjuntos de datos incluyen archivos CSV, ARFF, DATA, TXT, XLS, etc. La mayoría de ellos proporcionan un conjunto de archivos de conjuntos de datos de ejemplo que puede importar para su análisis.
En cuanto a las operaciones, permiten manipular datos, clasificarlos, asociarlos, regresarlos, agruparlos, modelarlos y visualizarlos. Cada una de ellas proporciona varios algoritmos para apoyar las tareas respectivas. Por ejemplo, para Clustering, puede utilizar algoritmos K-Means, Kohonen-SOM, LVQ, Neighborhood Graph, etc. Para Asociación , puede aplicar reglas A priori, A priori MR, A priori PT, Assoc Outlier, Frequent Itemsets, etc. Para Visualización de datos , se pueden utilizar métodos Scaterrplots, Box Plot, Distribution, Heat Map, etc., etc. Uno de ellos es un software de minería de datos de texto que permite analizar los datos de texto utilizando diversos métodos
.
Los resultados se pueden ver en la interfaz y también se pueden guardar como informes en diferentes formatos. En definitiva, se trata de un buen software que puede utilizar para tareas de minería de datos de forma gratuita.
Mi software favorito de minería de datos para Windows:
Me gustó bastante Weka ya que proporciona todas las herramientas suficientes para realizar tareas primarias de minería de datos. Tampoco es tan difícil de usar. Orange también es bueno para los profesionales, ya que proporciona un enfoque único para realizar operaciones de minería de datos que es mediante el uso de widgets.
También te pueden gustar algunos de los mejores programas gratuitos Free Spreadsheet Software , Data Visualization Tools , y Database Schema Designer para Windows.
Weka
Weka es un destacado software de minería de datos gratuito y de código abierto Windows, Mac y Linux. Contiene todas las herramientas esenciales necesarias para las tareas de minería de datos. Su interfaz principal se divide en diferentes aplicaciones que le permiten realizar diversas tareas, incluyendo la preparación de datos, clasificación, regresión, clustering, minería de reglas de asociación y visualización. Dispone de varias técnicas y algoritmos para realizar estas tareas. Veamos sus principales características:
Minería de datos con Weka:
Estas son las aplicaciones que dividen las tareas de minería de datos en secciones fácilmente manejables:
- Explorer: Esta aplicación se utiliza para el preprocesamiento de datos, la clasificación de datos, la agrupación de datos, la asociación y la visualización de datos. Puede abrir archivos de datos en varios formatos, como arff, data, CSV, JSON, archivos ASCII de Matlab, dat, etc. También puede abrir un conjunto de instancias desde una URL o una base de datos. También proporciona una herramienta llamada DataGenerator para generar datos artificiales. Se puede elegir entre varias reglas de clasificación, como DecisionTable, OneR, PART, ZeroR, etc. Se puede elegir entre los algoritmos de agrupación EM, Canopy, Cobweb, FarthestFirst, FilteredClusterer, HierarchicalClusterer, SimpleKMeans, etc. Se pueden utilizar reglas de asociación como Apriori, FilteredAssociator y FPGrowth. Dispone de una pestaña llamada Seleccionar atributos que básicamente evalúa la relevancia de los atributos. Para ello, puede seleccionar un evaluador de atributos (CfsSubsetEval, ClassifierAttributeEval, OneRAttributeEval, InfoGainAttributeEval, etc.) y un método (GreedyStepwise, BestFirst, Ranker). La salida respectiva se muestra en pestañas respectivas para cada una de las tareas mencionadas.
- KnowledgeFlow: Realiza los mismos procesos de minería de datos que los mencionados en Explorer, pero con más herramientas. Maneja los datos de forma incremental o por lotes. Algunas de sus características son: filtrado en cadena, mostrar los modelos producidos por los clasificadores para cada pliegue en una validación cruzada y visualizar el rendimiento de los clasificadores incrementales durante el procesamiento. También dispone de numerosos métodos de visualización de datos, como el visor de texto, el visor de imágenes, el resumidor de atributos, el gráfico de bandas, el gráfico de rendimiento del modelo, el trazador de límites, la matriz de dispersión, el visor de gráficos y el análisis de coste-beneficio.
- Experimenter: Con esta aplicación puede crear, ejecutar y analizar experimentos de diferentes tipos, como la validación cruzada, la división porcentual tren/prueba, la experimentación aleatoria, la experimentación por lotes y la experimentación por lotes.
resultado de la división, resultado de la tasa de aprendizaje, etc. Puede definir un conjunto de datos, especificar los controles de iteración y elegir un algoritmo para realizar el experimento.
También se proporciona una aplicación Workbench que se utiliza para realizar las mismas tareas que las mencionadas en las aplicaciones anteriores.
En definitiva, se trata de un buen software gratuito de minería de datos.
En resumen, se trata de un buen software gratuito de minería de datos. Tampoco es tan difícil de manejar, pero si todavía tiene dificultades, puede consultar este video tutorial para ver explicaciones detalladas de las tareas.
Página de inicio | Página de descarga
Orange
Orange es otro software de minería de datos gratuito y de código abierto para Windows. Proporciona varias herramientas para la manipulación de datos, el modelado de datos, la visualización de datos y el análisis de datos. Divide estas tareas en diferentes categorías para realizarlas fácilmente.
Características de Orange:
- Datos: Proporciona herramientas para la manipulación de datos. Las principales herramientas que proporciona son Pintar Datos, Muestreador de Datos, Clasificar y Filtrar Datos, Combinar Conjuntos de Datos, Transponer Tabla de Datos, Aleatorizar, Continuar, Constructor de Características, Purgar Dominio, Discretizar, Valores Atípicos, etc.
- Visualizar: Aquí, puede realizar la visualización de datos. Puede visualizar los datos utilizando varios métodos, como Tree Viewer, Box Plot, Distribution, Scatter Plot, Sieve Diagram, FreeViz projection, Linear projection, Radviz, Heat Map, Venn Diagram, SIlhoutte Plot, Pythagorean Tree Visualization, Nomogram, etc.
- Model: Dispone de varios modelos para la tarea de modelado y predicción de datos. Entre ellos se incluyen CN2 Rule Induction, Constant, Linear Regression, Logistic Regression, Naive Bayes, AdaBoost, Neural Network, Stochastic Gradient Descent, etc.
- Evaluate: Desde aquí, puede evaluar la clasificación o el rendimiento de la regresión utilizando varias técnicas de estimación como Test & Score, Predictions, Confusion Matrix, ROC Analysis, Lift Curve y Calibration Plot.
- Text Mining: Contiene herramientas de minería y análisis de texto como preprocesamiento de texto, minería de texto de Twitter, minería de texto de Wikipedia, análisis de sentimiento, bolsa de palabras, etc.
- Unsupervised: Este módulo se utiliza para el aprendizaje no supervisado que proporciona herramientas para leer distancias de archivos, ver matrices de distancias, agrupación jerárquica, análisis de correspondencias, escalado multidimensional, aprendizaje múltiple, etc.
Cómo utilizar Orange:
Para trabajar con este software, necesita utilizar varias herramientas como widgets. Para crear widgets, puedes arrastrar las herramientas desde el panel izquierdo y soltarlas en el lienzo. Por ejemplo, para importar un conjunto de datos, arrastre y suelte la herramienta Archivo en el lienzo. Puede conectar un widget a otro para realizar la tarea correspondiente en el conjunto de datos y ver los resultados. Aquí tienes un rápido vídeo tutorial para empezar a utilizar este software.
Este es otro buen software de minería de datos que se proporciona gratuitamente.
Página de inicio | Página de descarga
Tanagra
Tanagra es otro software gratuito de minería de datos para Windows. Permite realizar diferentes operaciones de minería de datos. Estas operaciones incluyen Asociación, Regresión, Clustering, Spv Learning, Meta-spv Learning, Estadística, Estadística No Paramétrica, Análisis Factorial, PLS, Spv Learning Assesment, y Visualización de Datos. Todas estas tareas de minería de datos pueden realizarse utilizando diversos algoritmos y técnicas relacionados. En primer lugar, le permite importar conjuntos de datos en TXT, ARFF, y XLS y crear una minería de datos
diagrama de minería con él. A continuación, puede utilizar cualquiera de las operaciones de minería de datos antes mencionadas para extraer información útil. El diagrama de minería de datos puede copiarse como imagen o guardarse como diagrama de minería de datos de texto (tdm) o diagrama de minería de datos binario (bdm). También se puede guardar localmente un informe de resultados en formato HTML.
Veamos cuáles son los algoritmos que se obtienen para realizar una tarea de minería de datos en él:
- Asociación: A priori, A priori MR, A priori PT, Assoc Outlier, Frequent Itemsets, Spv Assoc Rule, Spv Assoc Tree.
- Regresión: Reg. de eliminación hacia atrás, Árbol de regresión C-RT, DfBetas, Epsilon SVR, Regresión de entrada hacia delante, Regresión lineal múltiple, Nu SVR, Detección de valores atípicos, Evaluación de la regresión, Árbol de regresión, Regresión simultánea.
- Clustering: CT, CTP, EM-Clustering, EM-Selection, HAC, K-Means, Kohonen-SOM, LVQ, Neighborhood Graph, VARCLUS, VARHCA, VARKMeans.
- Visualización de datos: Correlation Scatterplot, Export dataset, Scatterplot, Scatterplot with Labels, View Dataset, View multiple scatterplots.
- Aprendizaje de Spv: Regresión logística binaria, C4. 5, C-PLS, C-RT, CS-CRT, CS-MC4, C-SVC, Decision List, ID3, K-NN, Linear Discriminant Analysis, Log-Reg TRIRLS, Multilayer Perception, Multinomial Logistic Regression, Naive Bayes, Naive Bayes Continuous, PLS-DA, PLS-LDA, Prototype-NN, Radial Basis Function, Rnd Tree, Rule Induction, SVM.
- Aprendizaje Meta-spv: Arcing, Bagging, Boosting, Cost Sensitive Bagging, Const Sensitive Learning, Multicost, Supervised Learning.
- Evaluación del Aprendizaje Spv: Descomposición Bias-Varianza, Bootstrap, Cross-Validation, Test de Hosmer Lemeshow, leave-One-Out, Residuales de Regresión Logística, Test, Train Test.
- Estadística: ANOVA Bloques aleatorizados, Prueba de Bartlett, Prueba M de Box, Prueba de Brown-Forsythe, Prueba de Fisher; Caracterización de grupos, Exploración de grupos, T2 de Hotelling, T2 heteroscedástica de Hotelling, Prueba de Levene, Correlación lineal, Más estadísticas univariantes, Prueba de normalidad, ANOVA unidireccional, MANOVA unidireccional, Prueba T pareada, Prueba V pareada, Correlación parcial, Correlación semiparcial, Prueba T, Prueba T de varianza desigual, Estadísticas continuas univariantes, Estadísticas discretas univariantes, Detección de valores atípicos univariantes, ANOVA de Welch.
- Estadística no paramétrica: Ansari-Bradley Scale Test, Categorical r, Cochran's Q-test, Contingency Chi-Square, Friedman's ANOVA by Ranks, FYTH 1-way ANOVA, Goodman Krushkal Gamma, Goodman Krushkal Lambda, Goodman Krushkal Tau, Kendall Tau-b, Kendall Tau-c, Kendall's tau, Kendall's Concordance W, Klotz Scale Test, Kruskal-Wallis 1-way ANOVA, K-S 2-sample test, Mann-Whitney Comparison, Median Test, Mood Runs Test, Mood Scale Test, Partial Theil U, Sign Test, Sommers d, Spearman's rho, Theil U, Van der Waerden 1-way ANOVA, Wald-Wolfowitz Runs Test, Wilcoxon Signed Ranks Test.
- Análisis factorial: Análisis discriminante canónico, Análisis de correspondencias, Rotación factorial, Análisis de correspondencias múltiples, NIPALS, Análisis de componentes principales.
- PLS: PLS Conf. Interval, PLS Factorial, PLS Regression, PLS Selection, PLSR.
- Scoring: List Curve, Posterior Prob, Precision-Roll Curve, Reliability Diagram, Roc Curve, Scoring.
- Feature Construction: Binary Binning, Trend, Residual Scores, MDLPC, Cont to Disc, etc.
Proporciona bastantes herramientas para realizar tareas de minería de datos. Para comprenderlo mejor, puede consultar este videotutorial .
&
Página de inicio | Página de descarga
NeoNeuro Data Mining
NeoNeuro Data Mining es el siguiente software de minería de datos de esta lista. Básicamente permite el aprendizaje automático para varias tareas de agrupación comunes y multidimensionales.
En él, puede abrir conjuntos de datos en formatos TXT, CSV, XLS, etc. También puede crear un nuevo conjunto de datos para
para realizar tareas relacionadas. Ofrece una sección de Cálculo que contiene opciones como Validación cruzada, Cálculo de series, etc. También proporciona una herramienta de Análisis para el análisis de datos que estima los parámetros más importantes y representa visualmente la influencia de cada valor paramétrico. También crea fórmulas de Excel que puede utilizar en sus procesos empresariales o investigaciones científicas. Consulte este video tutorial si tiene alguna dificultad para entenderlo.
Nota: Es de uso gratuito y no comercial.
Página de inicio | Página de descarga
khcoder
khcoder es básicamente un software de minería de datos de texto y se utiliza para el análisis cuantitativo de contenido. Ofrece muchas herramientas de análisis, como la asociación de palabras, la concordancia KWIC, las estadísticas descriptivas, el análisis de correspondencias, el escalado multidimensional, el análisis jerárquico de conglomerados, la red de coocurrencia, el mapa autoorganizado y la lista de frecuencias. También ofrece una herramienta de clasificación Naive Bayes
.
Se utiliza básicamente para el análisis de texto. Procesa archivos de texto y crea resultados de número de frases, párrafo, tokens, memo, lista de frecuencias, frecuencia de co-ocurrencia, etc. Además, puede añadir plugins a este software para añadir más funciones a este software. Los resultados finales pueden guardarse en su formato nativo.
Contenidos relacionados
No se ha encontrado ninguno
Subir
Deja una respuesta