Download da ferramenta Orange: um guia para mineração de dados e aprendizado de máquina
Se você estiver procurando por uma ferramenta gratuita e de código aberto que possa ajudá-lo com mineração de dados, aprendizado de máquina e visualização de dados, talvez queira conferir a Orange Tool. Orange Tool é uma plataforma poderosa e fácil de usar que permite realizar análises de dados e criar fluxos de trabalho visualmente, sem codificação. Neste artigo, mostraremos o que é o Orange Tool, como baixá-lo e instalá-lo, como usá-lo para análise e visualização de dados e como estendê-lo com complementos e scripts Python.
orange tool download
Download: https://urlca.com/2vR4HX
O que é a Ferramenta Laranja?
Orange Tool é um kit de ferramentas de visualização de dados e aprendizado de máquina de código aberto desenvolvido no Laboratório de Bioinformática da Faculdade de Ciência da Computação e da Informação da Universidade de Ljubljana, Eslovênia. Possui um front-end de programação visual para análise exploratória de dados e visualização interativa de dados, e também pode ser usado como uma biblioteca Python para manipulação de dados e alteração de widgets.
Recursos e benefícios da Orange Tool
Alguns dos recursos e benefícios do Orange Tool são:
Ele suporta vários formatos de dados, como CSV, Excel, SQL, JSON, etc.
Ele oferece uma grande caixa de ferramentas de widgets para pré-processamento de dados, seleção de recursos, agrupamento, classificação, regressão, avaliação, etc.
Ele permite a exploração e visualização interativa de dados com widgets para distribuições estatísticas, gráficos de caixa, gráficos de dispersão, árvores de decisão, agrupamento hierárquico, mapas de calor, MDS, projeções lineares, etc.
Ele permite fácil comparação e teste de diferentes algoritmos e preditores de aprendizado de máquina.
Ele suporta treinamento prático e ilustrações visuais de conceitos da ciência de dados.
Pode ser estendido com add-ons para bioinformática, mineração de texto, análise de rede, mineração de regras de associação, etc.
Ele pode ser integrado a scripts Python para funcionalidade e personalização avançadas.
Como baixar e instalar o Orange Tool
Você pode baixar o Orange Tool em seu site oficial ou no repositório Python Package Index. A versão mais recente é 3.35.0 em maio de 2023. Você pode escolher entre um instalador autônomo ou uma versão portátil para Windows. Para usuários de Mac OS X e Linux, você precisa ter o Python 3.6 ou superior instalado em seu sistema antes de instalar o Orange Tool.
Para instalar o Orange Tool usando o instalador autônomo, siga estas etapas:
Baixe o arquivo do instalador (Orange3-3.35.0-Miniconda-x86_64.exe) do site.
Execute o arquivo do instalador e siga as instruções na tela.
Selecione os componentes que deseja instalar (Orange Canvas, ambiente Miniconda Python 3.7).
Selecione a pasta de instalação e clique em Avançar.
Aguarde a conclusão da instalação e clique em Concluir.
Para instalar o Orange Tool usando a versão portátil, siga estas etapas:
Baixe o arquivo zip (Orange3-3.35.0.zip) do site.
Extraia o arquivo zip para uma pasta de sua escolha.
Execute o arquivo executável Orange Canvas (Orange-canvas.exe) da pasta.
Para instalar o Orange Tool usando pip, siga estas etapas:
Abra uma janela de terminal e digite pip instalar orange3.
Aguarde a conclusão da instalação.
Tipo lona laranja para iniciar o aplicativo Orange Canvas.
Como usar a Orange Tool para análise e visualização de dados
Depois de instalar o Orange Tool, você pode começar a usá-lo para análise e visualização de dados. A interface principal do Orange Tool é o Orange Canvas, que é um ambiente de programação visual onde você pode criar fluxos de trabalho conectando widgets. Os widgets são as unidades básicas de funcionalidade no Orange Tool e podem executar várias tarefas, como carregar dados, pré-processar dados, aplicar algoritmos de aprendizado de máquina, avaliar modelos e exibir resultados.
Programação visual com widgets
Para criar um fluxo de trabalho no Orange Canvas, você precisa arrastar e soltar os widgets da caixa de ferramentas à esquerda para a tela à direita.Você pode conectar os widgets desenhando linhas entre suas portas de entrada e saída. As portas de entrada estão no lado esquerdo do widget e as portas de saída estão no lado direito. Você também pode clicar duas vezes em um widget para abrir suas configurações e opções.
Por exemplo, se você deseja carregar um arquivo CSV e exibir suas estatísticas resumidas, pode usar o seguinte fluxo de trabalho:
Arraste e solte o widget Arquivo da seção Dados da caixa de ferramentas para a tela.
Clique duas vezes no widget Arquivo e navegue para selecionar seu arquivo CSV.
Arraste e solte o widget Data Table da seção Data da caixa de ferramentas para a tela.
Conecte a porta de saída do widget Arquivo à porta de entrada do widget Tabela de Dados.
Clique duas vezes no widget Data Table para ver os dados em um formato tabular.
Arraste e solte o widget Box Plot da seção Visualizar da caixa de ferramentas para a tela.
Conecte a porta de saída do widget Arquivo à porta de entrada do widget Box Plot.
Clique duas vezes no widget Box Plot para ver as estatísticas resumidas de cada coluna em seus dados.
O fluxo de trabalho resultante deve ficar assim:
Exploração de dados e visualização interativa
Um dos pontos fortes do Orange Tool é sua capacidade de fornecer exploração e visualização interativa de dados. Você pode usar vários widgets para explorar seus dados e descobrir padrões, tendências, discrepâncias, correlações, etc. Você também pode usar widgets para filtrar, selecionar, agrupar ou anotar seus dados com base em diferentes critérios. Além disso, você pode usar widgets para comunicar suas descobertas e percepções com outras pessoas por meio de relatórios, painéis ou apresentações.
Por exemplo, se você deseja explorar um conjunto de dados de flores de íris e visualizar seus recursos e classes, pode usar o seguinte fluxo de trabalho:
Arraste e solte o widget Arquivo da seção Dados da caixa de ferramentas para a tela.
Clique duas vezes no widget Arquivo e selecione "iris.tab" na lista de conjuntos de dados de amostra.
Arraste e solte o widget Scatter Plot da seção Visualizar da caixa de ferramentas para a tela.
Conecte a porta de saída do widget File à porta de entrada do widget Scatter Plot.
Clique duas vezes no widget Scatter Plot para ver um gráfico de dispersão de dois recursos (por exemplo, comprimento da sépala e largura da sépala) de flores de íris coloridas por sua classe (setosa, versicolor ou virginica).
Arraste e solte outro widget Scatter Plot da seção Visualizar da caixa de ferramentas para a tela.
Conecte outra porta de saída do widget File a outra porta de entrada deste widget Scatter Plot.
Clique duas vezes neste widget Scatter Plot para ver um gráfico de dispersão de dois outros recursos (por exemplo, comprimento da pétala e largura da pétala) de flores de íris coloridas por sua classe.
Selecione alguns pontos em um gráfico de dispersão e veja como eles são destacados em outro gráfico de dispersão. Isso mostra como diferentes recursos estão relacionados entre si e com a variável de classe.
O fluxo de trabalho resultante deve ficar assim:
Aprendizado de máquina e modelagem preditiva
Outro ponto forte da Orange Tool é o suporte para aprendizado de máquina e modelagem preditiva. Você pode usar vários widgets para aplicar diferentes algoritmos de aprendizado de máquina (como agrupamento k-means, k-vizinhos mais próximos, árvores de decisão, regressão logística, redes neurais, etc.) aos seus dados e comparar seu desempenho. Você também pode usar widgets para avaliar seus modelos usando métricas diferentes (como exatidão, precisão, rechamada, pontuação F1, curva ROC etc.) e visualizá-los usando widgets (como Matriz de confusão, Análise ROC, Gráfico de calibração etc.). Você também pode usar widgets para ajustar os parâmetros do modelo usando pesquisa em grade ou pesquisa aleatória.
Por exemplo, se você deseja criar um modelo preditivo para o conjunto de dados de íris e avaliar seu desempenho, pode usar o seguinte fluxo de trabalho:
Arraste e solte o widget Arquivo da seção Dados da caixa de ferramentas para a tela.
Clique duas vezes no widget Arquivo e selecione "iris.tab" na lista de conjuntos de dados de amostra.
Arraste e solte o widget Teste e Pontuação da seção Avaliar da caixa de ferramentas para a tela.
Conecte a porta de saída do widget Arquivo à porta de entrada do widget Teste e Pontuação.
Arraste e solte o widget k-Means da seção Não supervisionado da caixa de ferramentas para a tela.
Conecte outra porta de saída do widget Arquivo a outra porta de entrada do widget Teste e Pontuação.
Conecte a porta de saída do widget k-Means a outra porta de entrada do widget Test and Score.
Clique duas vezes no widget Test and Score para ver uma tabela de pontuações para diferentes classificadores (como k-Means, Majority, Naive Bayes, etc.) em diferentes métricas (como AUC, CA, F1, Precision, Recall, etc.).
Arraste e solte o widget Matriz de Confusão da seção Avaliar da caixa de ferramentas para a tela.
Conecte outra porta de saída do widget Teste e pontuação a outra porta de entrada do widget Matriz de confusão.
Clique duas vezes no widget Confusion Matrix para ver uma matriz de classes verdadeiras e previstas para cada classificador.
O fluxo de trabalho resultante deve ficar assim:
Como estender a Orange Tool com complementos e scripts Python
Se você deseja adicionar mais funcionalidade ou personalização ao Orange Tool, pode usar complementos e scripts Python. Complementos são módulos adicionais que fornecem mais widgets para domínios ou tarefas específicas. Os scripts Python são trechos de código que podem ser executados na ferramenta Orange ou usados para modificar widgets existentes.
Complementos disponíveis para Orange Tool
Existem muitos complementos disponíveis para o Orange Tool que podem aprimorar seus recursos. Alguns deles são:
Bioinformática: Fornece widgets para análise de expressão gênica, enriquecimento de ontologia gênica, análise de sobrevivência, etc.
Texto: fornece widgets para mineração de texto, processamento de linguagem natural, análise de sentimento, modelagem de tópicos, etc.
Rede: Fornece widgets para análise de rede, visualização de gráficos, detecção de comunidade, etc.
Associar: Fornece widgets para mineração de regras de associação, extração frequente de conjuntos de itens, etc.
Educacional: fornece widgets para ensinar e aprender conceitos e técnicas de ciência de dados.
Para instalar um complemento para Orange Tool, siga estas etapas:
Abra o Orange Canvas e clique em Opções na barra de menus.
Selecione Complementos no menu suspenso.
Selecione o complemento que deseja instalar na lista e clique em OK.
Aguarde a conclusão da instalação e reinicie o Orange Canvas.
Como escrever e executar scripts Python na Orange Tool
Se você deseja escrever e executar scripts Python na Orange Tool, pode usar o widget Python Script da seção Data da caixa de ferramentas. Este widget permite escrever código Python que pode acessar e manipular dados de outros widgets ou enviar dados para outros widgets. Você também pode importar outras bibliotecas ou módulos Python em seu script.
Para escrever e executar um script Python na Orange Tool, siga estas etapas:
Arraste e solte o widget Python Script da seção Dados da caixa de ferramentas para a tela.
Conecte uma porta de entrada de outro widget (como Arquivo) a uma porta de entrada do widget Python Script.
Clique duas vezes no widget Python Script para abrir a janela do editor.
Digite seu código Python na janela do editor. Você pode usar in_data para acessar os dados de entrada de outro widget e out_data para enviar dados para outro widget.
Clique no botão Executar para executar seu script.
Conecte uma porta de saída do widget Python Script a uma porta de entrada de outro widget (como Data Table) para ver os dados de saída.
Por exemplo, se você deseja escrever um script Python que adiciona uma nova coluna ao conjunto de dados da íris com a proporção comprimento/largura das pétalas, você pode usar o seguinte código:
import Orange import numpy as np # obtém os dados de entrada data = in_data # cria uma nova coluna com a proporção entre o comprimento e a largura da pétala ratio = np.array([d["comprimento da pétala"] / d["largura da pétala"] para d nos dados]) ratio_attr = Orange.data.ContinuousVariable("petal ratio") new_data = Orange.data.Table.from_numpy( Orange.data.Domain(data.domain.attributes + (ratio_att r,), data.domain.class_var), np.hstack((data.X, ratio.reshape(-1, 1))), Y=data.Y ) # saída dos novos dados out_data = new_data
O fluxo de trabalho resultante deve ficar assim:
Conclusão
Neste artigo, apresentamos a Orange Tool, uma ferramenta gratuita e de código aberto para mineração de dados e aprendizado de máquina. Mostramos como baixar e instalar o Orange Tool, como usá-lo para análise e visualização de dados e como estendê-lo com complementos e scripts Python. Esperamos que você tenha achado este artigo útil e informativo e que experimente a Orange Tool em seu próximo projeto de ciência de dados.
perguntas frequentes
Aqui estão algumas perguntas frequentes sobre a ferramenta Orange:
Quais são os requisitos de sistema para o Orange Tool?
O Orange Tool pode ser executado nos sistemas operacionais Windows, Mac OS X e Linux. Requer Python 3.6 ou superior e um mínimo de 4 GB de RAM. Também requer alguns pacotes Python adicionais, como numpy, scipy, scikit-learn, pandas, etc., que são instalados automaticamente com a ferramenta Orange.
Onde posso encontrar mais documentação e tutoriais para a Orange Tool?
Você pode encontrar mais documentação e tutoriais para a Orange Tool em seu site oficial, seu repositório GitHub, seu canal no YouTube e seu blog. Você também pode encontrar alguns livros e cursos que usam a Orange Tool para ensinar e aprender ciência de dados.
Como posso obter ajuda ou suporte para a Orange Tool?
Você pode obter ajuda ou suporte para a Orange Tool ingressando no fórum da comunidade, no servidor Discord ou na lista de discussão. Você também pode relatar bugs ou solicitar recursos em seu rastreador de problemas GitHub.
Como posso contribuir com a Orange Tool?
Você pode contribuir com a Orange Tool enviando solicitações de pull ou patches em seu repositório GitHub, criando ou melhorando complementos ou widgets, escrevendo documentação ou tutoriais, testando ou revisando código, traduzindo ou localizando a interface, doando ou patrocinando o projeto ou divulgando-o.
A Orange Tool está relacionada à Orange Data Mining?
Sim, Orange Tool é o mesmo que Orange Data Mining. O nome "Ferramenta Laranja" é usado neste artigo para evitar confusão com a cor laranja ou a fruta laranja. No entanto, o nome oficial do projeto é "Orange Data Mining" ou simplesmente "Orange".
0517a86e26
Commentaires