<?xml version="1.0" encoding="UTF-8" ?>
<?xml-stylesheet type="text/xsl" href="http://blogs.msdn.com/utility/FeedStylesheets/rss.xsl" media="screen"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:wfw="http://wellformedweb.org/CommentAPI/"><channel><title>SQL Server: um Endpoint Brasileiro : Analysis Services Add-in</title><link>http://blogs.msdn.com/procha/archive/tags/Analysis+Services+Add-in/default.aspx</link><description>Tags: Analysis Services Add-in</description><dc:language>en-US</dc:language><generator>CommunityServer 2.1 SP1 (Build: 61025.2)</generator><item><title>Data Mining com Excel 2007</title><link>http://blogs.msdn.com/procha/archive/2008/02/13/data-mining-com-excel-2007.aspx</link><pubDate>Wed, 13 Feb 2008 20:04:47 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:7677748</guid><dc:creator>procha</dc:creator><slash:comments>2</slash:comments><comments>http://blogs.msdn.com/procha/comments/7677748.aspx</comments><wfw:commentRss>http://blogs.msdn.com/procha/commentrss.aspx?PostID=7677748</wfw:commentRss><wfw:comment>http://blogs.msdn.com/procha/rsscomments.aspx?PostID=7677748</wfw:comment><description>&lt;p&gt;&amp;#160;&lt;/p&gt;  &lt;p&gt;Existem muitos mitos em torno de Data Mining. O principal deles diz que Data Mining &amp;#233; algo que est&amp;#225; fora do alcance dos usu&amp;#225;rios comuns. Dizem que Data Mining requer treinamento espec&amp;#237;fico e que as ferramentas que o fazem s&amp;#227;o, em geral, caixas pretas das quais n&amp;#227;o tiramos proveito nenhum. Para quebrar tais mitos, nada melhor do que demonstrar como utilizar os algoritmos de Data Mining do SQL Server a partir do Office Excel - f&amp;#225;cil, simples, poderoso e todo mundo j&amp;#225; conhece. &lt;/p&gt;  &lt;h3&gt;O que &amp;#233; Data Mining?&lt;/h3&gt;  &lt;p&gt;Data Mining &amp;#233; um processo de an&amp;#225;lise dos dados a fim de se identificar informa&amp;#231;&amp;#245;es relevantes. Tais informa&amp;#231;&amp;#245;es podem representar tend&amp;#234;ncias, comportamentos, determinar perfis, agrupar registros em comum ou v&amp;#225;rias outras tarefas. Quando eu estava na escola, aos 7 ou 8 anos de idade, ficava perguntando para minha professora (e para os meus pais) por que eu precisava aprender Hist&amp;#243;ria. Achava chato e desnecess&amp;#225;rio. A resposta que eu tinha, em geral, era: &amp;quot;-Precisamos estudar hist&amp;#243;ria para entender o presente e o futuro.&amp;quot;. Nunca entendi isso muito bem. Eu ia bem em matem&amp;#225;tica, portugu&amp;#234;s, ingl&amp;#234;s... mas ia muito mal em hist&amp;#243;ria. S&amp;#243; fui me interessar por hist&amp;#243;ria mais tarde. Com Data Mining, &amp;#233; a mesma coisa. Os terabytes de dados presentes nos datawarehouses podem nos ensinar muito sobre o que fizemos e, principalmente, sobre onde podemos chegar. E &amp;#233; isso que o Data Mining nos permite: fazer uma an&amp;#225;lise do seu hist&amp;#243;rico, a fim de se interpretar os dados e tomar decis&amp;#245;es melhores. &lt;/p&gt;  &lt;h3&gt;Algoritmos &lt;/h3&gt;  &lt;p&gt;O SQL Server 2005 Analysis Services j&amp;#225; traz implementa&amp;#231;&amp;#245;es dos principais algoritmos de Data Mining utilizados no mercado. A tabela abaixo indica alguns cen&amp;#225;rios e quais algoritmos se aplicam melhor: &lt;/p&gt;  &lt;p&gt;&amp;#160;&lt;/p&gt;  &lt;table cellspacing="0" cellpadding="2" width="921" border="1"&gt;&lt;tbody&gt;     &lt;tr&gt;       &lt;td valign="top" width="679"&gt;&lt;strong&gt;&lt;font size="3"&gt;Objetivo&lt;/font&gt;&lt;/strong&gt;&lt;/td&gt;        &lt;td valign="top" width="240"&gt;&lt;strong&gt;&lt;font size="3"&gt;Algoritimo&lt;/font&gt;&lt;/strong&gt;&lt;/td&gt;     &lt;/tr&gt;      &lt;tr&gt;       &lt;td valign="top" width="679"&gt;         &lt;p&gt;Prever um atributo discreto. Por exemplo, prever quando o destinat&amp;#225;rio de uma campanha de mala direta vai comprar um produto.&lt;/p&gt;       &lt;/td&gt;        &lt;td valign="top" width="240"&gt;         &lt;p&gt;Decision Trees&lt;/p&gt;          &lt;p&gt;Naive Bayes&lt;/p&gt;          &lt;p&gt;Clustering&lt;/p&gt;          &lt;p&gt;Neural Network&lt;/p&gt;          &lt;p&gt;Logistic Regression&lt;/p&gt;          &lt;p&gt;Linear Regression&lt;/p&gt;       &lt;/td&gt;     &lt;/tr&gt;      &lt;tr&gt;       &lt;td valign="top" width="679"&gt;         &lt;p&gt;Prever um atributo cont&amp;#237;nuo. Por exemplo, fazer a previs&amp;#227;o de vendas do pr&amp;#243;ximo ano.&lt;/p&gt;       &lt;/td&gt;        &lt;td valign="top" width="240"&gt;         &lt;p&gt;Decision Trees&lt;/p&gt;          &lt;p&gt;Time Series&lt;/p&gt;       &lt;/td&gt;     &lt;/tr&gt;      &lt;tr&gt;       &lt;td valign="top" width="679"&gt;         &lt;p&gt;Prever uma seq&amp;#252;&amp;#234;ncia. Por exemplo, realizar uma an&amp;#225;lise de seq&amp;#252;&amp;#234;ncia de clicks em um site.&lt;/p&gt;       &lt;/td&gt;        &lt;td valign="top" width="240"&gt;         &lt;p&gt;Sequence Clustering&lt;/p&gt;       &lt;/td&gt;     &lt;/tr&gt;      &lt;tr&gt;       &lt;td valign="top" width="679"&gt;         &lt;p&gt;Encontrar grupos de itens em comum em transa&amp;#231;&amp;#245;es. Por exemplo, analisar uma cesta de compras e sugerir produtos relacionados.&lt;/p&gt;       &lt;/td&gt;        &lt;td valign="top" width="240"&gt;         &lt;p&gt;Association Rules&lt;/p&gt;          &lt;p&gt;Decision Trees&lt;/p&gt;       &lt;/td&gt;     &lt;/tr&gt;      &lt;tr&gt;       &lt;td valign="top" width="679"&gt;         &lt;p&gt;Encontrar grupos com itens similares. Por exemplo, segmentar dados demogr&amp;#225;ficos em grupos para entender melhor o relacionamento entre os atributos. &lt;/p&gt;       &lt;/td&gt;        &lt;td valign="top" width="240"&gt;         &lt;p&gt;Clustering&lt;/p&gt;          &lt;p&gt;Sequence Clustering&lt;/p&gt;       &lt;/td&gt;     &lt;/tr&gt;   &lt;/tbody&gt;&lt;/table&gt;  &lt;p&gt;&amp;#160;&lt;/p&gt;  &lt;p&gt;O Analysis Services aceita plugins de terceiros para implementar outros algoritmos, caso sua necessidade n&amp;#227;o seja atendida pelos algoritmos que s&amp;#227;o oferecidos out-of-box. Voc&amp;#234; pode tamb&amp;#233;m desenvolver seu pr&amp;#243;prio algoritimo de Data Mining utilizando programa&amp;#231;&amp;#227;o .NET. &lt;/p&gt;  &lt;h3&gt;Data Mining no Excel 2007&lt;/h3&gt;  &lt;p&gt;Os algoritmos citados acima s&amp;#227;o oferecidos pelo Analysis Services e podem ser utilizados em seus cubos, ou at&amp;#233; em modelos de mining acessando dados em um banco de dados relacional. Isto todos j&amp;#225; sabem. O que algumas pessoas n&amp;#227;o sabem ainda &amp;#233; que toda a intelig&amp;#234;ncia do Analysis Services pode ser consumida atrav&amp;#233;s de APIs, ou a partir do Microsoft Office. Para esta segunda finalidade, foi desenvolvido um add-in de Data Mining para o Microsoft Excel que permite utilizar os recursos de an&amp;#225;lise de dados do Analysis Services em dados de tabelas do Excel. Isto mesmo, seus dados nem precisam estar em um SQL Server. Vamos ver como isto funciona.&lt;/p&gt;  &lt;p&gt;O Add-in de Data Mining para o Microsoft Office Excel 2007 est&amp;#225; dispon&amp;#237;vel em &lt;a title="http://www.microsoft.com/sql/technologies/dm/addins.mspx" href="http://www.microsoft.com/sql/technologies/dm/addins.mspx"&gt;http://www.microsoft.com/sql/technologies/dm/addins.mspx&lt;/a&gt;. J&amp;#225; de antem&amp;#227;o, lhe convido a instalar o Add-In e navegar pelos webcasts presentes neste mesmo site. Ele d&amp;#225; exemplos da utiliza&amp;#231;&amp;#227;o e mostra como funciona esta ferramenta (que na verdade &amp;#233; composta de tr&amp;#234;s add-ins: dois para o Excel e um para o Visio). &lt;/p&gt;  &lt;p&gt;Tendo instalado o Add-In, voc&amp;#234; vai perceber que duas Ribons novas s&amp;#227;o adicionadas: uma delas chamada Data Mining, que permite trabalhar com modelos de mining presentes em um Analysis Server, e uma outra chamada Analyse, que s&amp;#243; fica vis&amp;#237;vel quando voc&amp;#234; seleciona uma tabela dentro do Excel. &lt;/p&gt;  &lt;p&gt;&lt;a href="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image_2.png"&gt;&lt;img style="border-top-width: 0px; border-left-width: 0px; border-bottom-width: 0px; border-right-width: 0px" height="126" alt="image" src="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image_thumb.png" width="719" border="0" /&gt;&lt;/a&gt; &lt;/p&gt;  &lt;p&gt;Para utilizar os algoritmos de data mining em uma tabela de dados do Excel, basta selecionar a tabela e clicar no bot&amp;#227;o do algoritmo apropriado. &lt;/p&gt;  &lt;h4&gt;Um exemplo r&amp;#225;pido&lt;/h4&gt;  &lt;p&gt;A planilha de exemplo utiliza dados no cen&amp;#225;rio do banco de dados AdventureWorks, que faz parte dos samples do SQL Server 2005. AdventureWorks &amp;#233; uma empresa fict&amp;#237;cia de vendas de bicicletas e acess&amp;#243;rios. A tab SourceData da planilha de exemplo descreve o perfil de potenciais clientes, com informa&amp;#231;&amp;#245;es de renda anual, estado civil, idade e sexo entre outros, e no final diz se este cliente adquiriu uma bicicleta ou n&amp;#227;o (na coluna BikeBuyer). A id&amp;#233;ia do exemplo &amp;#233; mapearmos o perfil de cliente que compra uma bicicleta, para que possamos fazer uma mala direta direcionada a clientes com o mesmo perfil. Para fazer esta an&amp;#225;lise utilizando a planilha de exemplo do Add-in, siga os seguintes passos:&lt;/p&gt;  &lt;p&gt;1) Ap&amp;#243;s ter aberto a planilha (presente em Iniciar-&amp;gt; Programas -&amp;gt; Microsoft SQL Server 2005 DM Add-ins), clique na Sheet SourceData &lt;/p&gt;  &lt;p&gt;2) Selecione a tabela com dados de exemplo. Perceba que ao selecionar, o ribon &amp;quot;Analyze&amp;quot; fica dispon&amp;#237;vel. Clique no bot&amp;#227;o &amp;quot;Analyze Key Influencers&amp;quot;. Um assistente ser&amp;#225; iniciado&lt;/p&gt;  &lt;p&gt;3) &amp;#201; iniciado um assistente. Este assistente coleta informa&amp;#231;&amp;#245;es sobre as colunas que devem ser utilizadas por parte desta an&amp;#225;lise e qual &amp;#233; o atributo que devemos analisar. &lt;/p&gt;  &lt;p&gt;4) Em Column Selection, selecione BikeBuyer. Este &amp;#233; o atributo sobre o qual ser&amp;#225; feita a an&amp;#225;lise de influ&amp;#234;ncia, ou seja, o que tem de comum os clientes que tem BikeBuyer = Yes e o que tem em comum os clientes que tem BikeBuyer = No.&lt;/p&gt;  &lt;p&gt;&lt;a href="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image5.png"&gt;&lt;img style="border-top-width: 0px; border-left-width: 0px; border-bottom-width: 0px; border-right-width: 0px" height="370" alt="image" src="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image5_thumb.png" width="512" border="0" /&gt;&lt;/a&gt; &lt;/p&gt;  &lt;p&gt;5) Clique em Choose columns to be used for Analysis. Aqui voc&amp;#234; poder&amp;#225; escolher todos os atributos que ser&amp;#227;o utilizados na an&amp;#225;lise. O campo ID n&amp;#227;o &amp;#233; relevante para an&amp;#225;lise, assim como nosso RG ou CPF n&amp;#227;o determina se voc&amp;#234; tem o perfil de uma pessoa que compraria uma bicicleta ou n&amp;#227;o. Portanto, vamos remover este atributo e manter os demais&lt;/p&gt;  &lt;p&gt;&lt;a href="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image8.png"&gt;&lt;img style="border-top-width: 0px; border-left-width: 0px; border-bottom-width: 0px; border-right-width: 0px" height="268" alt="image" src="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image8_thumb.png" width="366" border="0" /&gt;&lt;/a&gt; &lt;/p&gt;  &lt;p&gt;6) Clique em Ok e depois em Run. &lt;/p&gt;  &lt;p&gt;Neste instante, o add-in passa os dados da tabela do Excel para o Analysis Services, que aplica o algoritmo de Data Mining mais apropriado aos dados. Ap&amp;#243;s a conclus&amp;#227;o, o add-in exibe j&amp;#225; no Excel o resultado da an&amp;#225;lise. Perceba que pessoas que n&amp;#227;o tem carro tem maior chance de comprar uma bicicleta, ssim como as que tem entre 36 e 46 anos. J&amp;#225; uma pessoa que tem 2 carros e 64 anos ou mais, baseando-se nos dados de prospecto que temos, n&amp;#227;o compraria uma bicicleta.&lt;/p&gt;  &lt;p&gt;&lt;a href="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image_6.png"&gt;&lt;img style="border-right: 0px; border-top: 0px; border-left: 0px; border-bottom: 0px" height="668" alt="image" src="http://blogs.msdn.com/blogfiles/procha/WindowsLiveWriter/DataMiningcomExcel2007_A8B4/image_thumb_1.png" width="631" border="0" /&gt;&lt;/a&gt;&amp;#160;&lt;/p&gt;  &lt;p&gt;O add-in vai muito al&amp;#233;m disto, este &amp;#233; apenas um exemplo r&amp;#225;pido e superficial. Lembre-se ainda que estes algoritmos podem ser consumidos a partir de uma aplica&amp;#231;&amp;#227;o .Net, o que significa que esta funcionalidade pode ser embutida dentro da sua aplica&amp;#231;&amp;#227;o. A partir da&amp;#237;, n&amp;#227;o existem mais limites. O principal desafio ao fazer Data Mining &amp;#233; o entendimento de neg&amp;#243;cio. &amp;#201; preciso saber qual a necessidade espec&amp;#237;fica que se tem e como melhor utilizar seus dados para ter o resultado desejado.&lt;/p&gt;  &lt;p&gt;Como sempre, fique a vontade para utilizar a &amp;#225;rea de coment&amp;#225;rios para postar suas d&amp;#250;vidas. &lt;/p&gt;&lt;img src="http://blogs.msdn.com/aggbug.aspx?PostID=7677748" width="1" height="1"&gt;</description><category domain="http://blogs.msdn.com/procha/archive/tags/SQL+Server+2008/default.aspx">SQL Server 2008</category><category domain="http://blogs.msdn.com/procha/archive/tags/SQL+Server+2005/default.aspx">SQL Server 2005</category><category domain="http://blogs.msdn.com/procha/archive/tags/SQL+Server+em+portugu_26002300_234_3B00_s/default.aspx">SQL Server em portugu&amp;#234;s</category><category domain="http://blogs.msdn.com/procha/archive/tags/SQL+Server/default.aspx">SQL Server</category><category domain="http://blogs.msdn.com/procha/archive/tags/Data+Mining/default.aspx">Data Mining</category><category domain="http://blogs.msdn.com/procha/archive/tags/Analysis+Services+Add-in/default.aspx">Analysis Services Add-in</category><category domain="http://blogs.msdn.com/procha/archive/tags/Excel+Data+Mining+Add-in/default.aspx">Excel Data Mining Add-in</category></item></channel></rss>