Posts recentes

O que é Text Mining e como esse recurso pode auxiliar seu negócio




Text Mining (que significa em Língua Portuguesa mineração de texto) é um subcampo da Ciência de Dados que utiliza ferramentas da Linguística, Computação e Estatística para obter padrões e informações a partir de textos, especialmente em contexto digital.

Com o aumento substancial da internet também em relação a documentos de linguagem natural nos mais diversos idiomas, a Ciência de Dados precisou se aproximar da Linguística por meio do Text Mining para que fossem desenvolvidas ferramentas com intuito de gerar padrões e informações em grandes quantidades de textos. O Text Mining é utilizado em diversos campos que vão da pesquisa científica aos negócios.

Essas técnicas e ferramentas podem fazer pesquisas em extensos volumes de texto. Recuperação, extração e reconhecimento de padrões textuais estão entre as tarefas normalmente realizadas. Há profundos e importantes padrões informacionais escondidos na imensidão textual disponível nos tempos atuais.

Como se trata de dados não estruturados, o trabalho com esse campo exige alguns procedimentos que permitam a correta seleção e tratamento dos dados. Vejamos:

1- Seleção dos documentos: é muito importante fazer o correto selecionamento do conjunto de textos a serem analisados, eles são a matéria-prima das análises;

2- Pré-processamento: essa etapa converte a base documental em estruturas compatíveis com os algoritmos utilizados na mineração;

3- Mineração: essa parte é basicamente a busca por padrões nos textos selecionados e pré-processados por meio de algoritmos;

4- Assimilação: os padrões descobertos são contextualizados e se transformam em informação e conhecimento aos usuários, cientistas e tomadores de decisão.

Muitas empresas têm usado o Text Mining como auxiliar nos processos de descoberta de conhecimento para agregar valor e assertividade às decisões estratégicas da empresa. A internet pode ser uma fonte muita rica de informações textuais, principalmente sobre as opiniões e sentimentos dos clientes em relação à imagem da empresa ou oferta de produtos.

Deixarei algumas ferramentas comuns disponíveis para Text Mining que são encontradas na rede. Até mais!

-TextAlyser;

-Wordcounter;

-TagCrowd.

Fernando Montini é cientista de dados, programador, pedagogo, químico industrial e mestre em Biologia.

Escreve para o blog sobre tecnologia na área de Ciência de Dados, Business Intelligence e Mercado Financeiro.

101 visualizações0 comentário

Posts recentes

Ver tudo
VEJA TAMBÉM