francescomecca.eu/output/blog/2016/11/10/machine-learning-intro/index.html
Francesco Mecca fc2d717f3b cv
2021-12-02 15:47:14 +00:00

279 lines
16 KiB
HTML

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width">
<title>Capire il Machine Learning (parte 1) | Caught in the Net</title>
<link rel="stylesheet" href="../../../../../assets/blog/fonts/opensans.css">
<link href="../../../../../assets/blog/css/normalize.css" rel="stylesheet" type="text/css">
<link href="../../../../../assets/blog/css/cayman.css" rel="stylesheet" type="text/css">
<meta name="theme-color" content="#5670d4">
<meta name="generator" content="Nikola (getnikola.com)">
<link rel="alternate" type="application/rss+xml" title="RSS" hreflang="en" href="../../../../../rss.xml">
<link rel="canonical" href="francescomecca.eu/blog/2016/11/10/machine-learning-intro/">
<meta name="author" content="Francesco Mecca">
<link rel="prev" href="../../../7/7/pres-berk/" title="A short talk about cryptography at the Berkman Klein Center" type="text/html">
<link rel="next" href="../../11/machine-learning-parte2/" title="Capire il Machine Learning (parte 2)" type="text/html">
<meta property="og:site_name" content="Caught in the Net">
<meta property="og:title" content="Capire il Machine Learning (parte 1)">
<meta property="og:url" content="francescomecca.eu/blog/2016/11/10/machine-learning-intro/">
<meta property="og:description" content="Questo è il primo di una serie di post che hanno l'obbiettivo di fornire una breve e generale introduzione al mondo del machine learning e delle intelligenze artificiali più in generale.
Mi auguro che">
<meta property="og:type" content="article">
<meta property="article:published_time" content="2016-11-10T00:00:00Z">
<meta property="article:tag" content="AI">
<meta property="article:tag" content="algoritmi genetici">
<meta property="article:tag" content="Genetic algorithm">
<meta property="article:tag" content="Neural networks">
<meta property="article:tag" content="PesceWanda">
<meta property="article:tag" content="programming">
<meta property="article:tag" content="reti neurali">
</head>
<body>
<div id="container">
<section class="page-header"><h1 class="project-name">
Caught in the Net
</h1>
<h2 class="project-tagline">La rete ti cattura ma libera il pensiero</h2>
<a class="btn" href="../../../../../">Home</a>
<a class="btn" href="../../../../../pages/about/">About me</a>
<a class="btn" href="../../../../../pages/contattami/">Contact me</a>
<a class="btn" href="../../../../../archiveall.html">Archive</a>
<a class="btn" href="../../../../../rss.xml">RSS</a>
<a class="btn" href="http://francescomecca.eu/git/pesceWanda">Personal Git</a>
<a class="btn" href="https://github.com/FraMecca">Github</a>
<a class="btn" href="https://francescomecca.eu/git/pesceWanda/Curriculum_vitae/raw/master/latex.dir/francesco_mecca_cv_eng.pdf">Curriculum</a>
</section><section class="main-content"><div class="post">
<header><h1 class="post-title">
<h1 class="p-name post-title" itemprop="headline name">Capire il Machine Learning (parte 1)</h1>
</h1>
</header><p class="dateline post-date">10 November 2016</p>
</div>
<div class="e-content entry-content" itemprop="articleBody text">
<div>
<p>Questo è il primo di una serie di post che hanno l'obbiettivo di fornire una breve e generale introduzione al mondo del machine learning e delle intelligenze artificiali più in generale.
Mi auguro che questa breve introduzione al mondo dell'apprendimento automatico sia una sorta di vaccino contro il sensazionalismo mediatico e la disinformazione che negli ultimi anni fanno da contorno al progresso in questo settore.</p>
<h3>Non c'è risultato senza algoritmo</h3>
<p>Nelle scienze informatiche un algoritmo è un insieme di istruzioni che partendo da uno stato iniziale (input) permette di arrivare ad uno stato finale (output) attraverso una serie di step logici.
Ogni algoritmo utilizza una logica propria e specifica per il problema di cui si occupa.
Nel caso del machine learning l'algoritmo non viene progettato in base al tipo di problema bensì vengono utilizzati algoritmi generici adattabili attraverso dei parametri.
L'algoritmo di machine learning analizza i vari parametri e i dati che riceve "in pasto" al fine di raggiungere lo stato di output ottimale.
L'output ottimale è la migliore approssimazione di un risultato teorico che si raggiunge nella fase di "training".</p>
<h3>La macchina impara</h3>
<p>Nella fase di allenamento o di apprendimento, il "training", si possono adottare due tecniche differenti: apprendimento con supervisione ( <strong>supervised learning</strong> ) e apprendimento senza supervisione ( <strong>unsupervised learning</strong> ).</p>
<h5>Supervised Learning</h5>
<p>Immaginiamo di dover valutare il prezzo di un'automobile usata senza essere esperti in materia.
Noi abbiamo questi dati:</p>
<table>
<thead><tr>
<th>PREZZO ORIGINALE</th>
<th align="center">Km percorsi</th>
<th align="center">stato di usura</th>
<th align="right">PREZZO FINALE</th>
</tr></thead>
<tbody>
<tr>
<td>50 000</td>
<td align="center">120 000</td>
<td align="center">lieve</td>
<td align="right">40 000</td>
</tr>
<tr>
<td>30 000</td>
<td align="center">150 000</td>
<td align="center">notevole</td>
<td align="right">8 000</td>
</tr>
<tr>
<td>20 000</td>
<td align="center">80 000</td>
<td align="center">lieve</td>
<td align="right">15 000</td>
</tr>
<tr>
<td>20 000</td>
<td align="center">120 000</td>
<td align="center">notevole</td>
<td align="right">...</td>
</tr>
</tbody>
</table>
<p>Dalla tabella possiamo dedurre la caratteristica fondamentale del <strong>supervised learning</strong>: abbiamo due vettori (serie di dati) di input (prezzo originale) e di output (prezzo finale) che hanno una correlazione certa e valida.</p>
<p>Possiamo dedurre intuitivamente quale sarà il prezzo dell'ultima auto se analizziamo i dati precedenti.
Questo è quello che succede nel caso del <strong>supervised learning</strong>.
Un algoritmo di machine learning che utilizza il <strong>supervised learning</strong> estrapolerà la relazione fra i vari dati e in questo modo potrà ottenere un determinato output partendo dai dati di input.
Possiamo capire già da ora che nel caso ci fossero dati che "inquinano" il nostro data set, come ad esempio il colore dell'auto, l'algoritmo non sarà capace di fare un'analisi corretta.</p>
<p>La precisione della soluzione dipende dalla quantità di dati e dall'influenza che questi hanno nella situazione reale.</p>
<h2>Unsupervised Learning</h2>
<p>Nel caso di unsupervised learning ci troviamo di fronte agli stessi dati ma senza la possibilità di conoscere il prezzo finale.</p>
<table>
<thead><tr>
<th>PREZZO ORIGINALE</th>
<th align="center">Km percorsi</th>
<th align="right">stato di usura</th>
</tr></thead>
<tbody>
<tr>
<td>50 000</td>
<td align="center">120 000</td>
<td align="right">lieve</td>
</tr>
<tr>
<td>30 000</td>
<td align="center">150 000</td>
<td align="right">notevole</td>
</tr>
<tr>
<td>20 000</td>
<td align="center">80 000</td>
<td align="right">lieve</td>
</tr>
<tr>
<td>20 000</td>
<td align="center">120 000</td>
<td align="right">notevole</td>
</tr>
</tbody>
</table>
<p>Non siamo capaci di stabilire il prezzo finale attraverso l'unsupervised learning, ma possiamo stabilire dei pattern fra i vari dati.
Non c'è nessun tipo di feedback (il prezzo finale) che possa aiutarci a capire se il risultato sia giusto ma possiamo analizzare le notevoli relazioni fra i dati.</p>
<h2>Machine Learning e intelligenza</h2>
<p>Concentriamoci sul <strong>supervised learning</strong>.
Nel caso della vendita dell'automobile, abbiamo un semplice problema con una soluzione lineare di questo tipo:
<em>prezzo finale</em> = <em>prezzo originale</em> + <em>km percorsi</em> + stato di usura</p>
<p>Ovviamente ogni incognita nella nostra equazione influisce diversamente sul prezzo finale e quindi possiamo riscriverla come:
<em>prezzo finale</em> = A <em><em>prezzo originale</em> + B </em><em>km percorsi</em> + C * stato di usura</p>
<p>Se pensiamo ad un algoritmo possiamo ragionare in questo modo:</p>
<pre class="code literal-block"><span></span><span class="n">funzione</span><span class="o">:</span> <span class="n">calcola_prezzo_auto</span><span class="o">:</span>
<span class="n">parametri</span><span class="o">:</span> <span class="n">prezzo_originale</span><span class="o">,</span> <span class="n">km_percorsi</span><span class="o">,</span> <span class="n">stato_usura</span>
<span class="n">variabili</span><span class="o">:</span> <span class="n">prezzo_finale</span> <span class="o">=</span> <span class="mi">0</span>
<span class="n">prezzo</span> <span class="n">finale</span> <span class="o">=</span> <span class="n">prezzo_originale</span> <span class="o">*</span> <span class="mf">0.804246</span>
<span class="n">prezzo</span> <span class="n">finale</span> <span class="o">=</span> <span class="n">prezzo_finale</span> <span class="o">+</span> <span class="n">km_percorsi</span> <span class="o">*</span> <span class="o">-</span><span class="mf">0.000125</span>
<span class="n">prezzo</span> <span class="n">finale</span> <span class="o">=</span> <span class="n">prezzo_finale</span> <span class="o">+</span> <span class="n">stato_usura</span> <span class="o">*</span> <span class="o">-</span><span class="mi">2500</span>
</pre>
<p>I valori di quelle costanti, stabilite casualmente nell'esempio, sono chiamate <em>pesi</em> e servono a stimare il prezzo finale.
Una volta stabiliti i pesi, il nostro algoritmo di supervised learning applica questi pesi ai dati originali e ne valuta l'errore:</p>
<table>
<thead><tr>
<th>PREZZO ORIGINALE</th>
<th align="center">Km percorsi</th>
<th align="center">stato di usura</th>
<th align="center">PREZZO FINALE</th>
<th align="right">PREZZO STIMATO</th>
</tr></thead>
<tbody>
<tr>
<td>50 000</td>
<td align="center">120 000</td>
<td align="center">lieve</td>
<td align="center">40 000</td>
<td align="right">374888</td>
</tr>
<tr>
<td>30 000</td>
<td align="center">150 000</td>
<td align="center">notevole</td>
<td align="center">8 000</td>
<td align="right">16000</td>
</tr>
<tr>
<td>20 000</td>
<td align="center">80 000</td>
<td align="center">lieve</td>
<td align="center">15 000</td>
<td align="right">13492</td>
</tr>
<tr>
<td>20 000</td>
<td align="center">120 000</td>
<td align="center">notevole</td>
<td align="center">...</td>
<td align="right">10988</td>
</tr>
</tbody>
</table>
<p>Una volta valutato l'errore e la distanza dal prezzo finale, l'algoritmo di machine learning modifica i pesi di conseguenza e ripete la procedura fino ad arrivare al risultato che più si avvicina ai dati iniziali.
<img alt="rete1" src="../../../../../wp-content/uploads/2016/reteneurale1.jpg">
Ci sono varie funzioni che stimano l'errore e permettono di correggere i pesi o metodi che restringono lo spazio di ricerca fino a convergere alla soluzione, ovvero i pesi cercati.</p>
<h3>Reti Neurali</h3>
<p>Ora, come possiamo immaginare, il prezzo di un'auto ha molti fattori che si aggiungono a quelli elencati nell'esempio.
Non solo, ma molti problemi non hanno una soluzione lineare, ovvero una soluzione che si può semplicemente esprimere attraverso una funzione che aggiunge e moltiplica i valori una sola volta.</p>
<p>Possiamo arricchire l'esempio dell'automobile immaginando di avere più set di pesi e di ripetere il procedimento più volte:</p>
<pre class="code literal-block"><span></span><span class="c">|</span><span class="nb">---------------------------------------------------</span><span class="c">|</span>
<span class="c">| PREZZO_ORIG * peso A1 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| KM_PERCORSI * peso B1 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| STATO_USURA * peso C1 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| PREZZO FINALE STIMATO 1|</span>
<span class="c">|</span><span class="nb">---------------------------------------------------</span><span class="c">|</span>
<span class="c">| </span><span class="nb">--------------------------------------------------</span><span class="c">|</span>
<span class="c">| PREZZO_ORIG * peso A2 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| KM_PERCORSI * peso B2 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| STATO_USURA * peso C2 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| PREZZO FINALE STIMATO 2|</span>
<span class="c">|</span><span class="nb">---------------------------------------------------</span><span class="c">|</span>
<span class="c">| </span><span class="nb">--------------------------------------------------</span><span class="c">|</span>
<span class="c">| PREZZO_ORIG * peso A3 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| KM_PERCORSI * peso B3 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| STATO_USURA * peso C3 </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| PREZZO FINALE STIMATO 3|</span>
<span class="c">|</span><span class="nb">---------------------------------------------------</span><span class="c">|</span>
</pre>
<p>E ora immaginiamo di combinare ogni PREZZO FINALE STIMATO in un'ultimo risultato:</p>
<pre class="code literal-block"><span></span><span class="c">| </span><span class="nb">--------------------------------------------------</span><span class="c">|</span>
<span class="c">| PREZZO_1 * peso X </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| PREZZO_2 * peso Y </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| PREZZO_3 * peso Z </span><span class="nb">-----</span><span class="nv">&gt;</span><span class="c"> |</span>
<span class="c">| PREZZO FINALE DEF |</span>
<span class="c">|</span><span class="nb">---------------------------------------------------</span><span class="c">|</span>
</pre>
<p>Questa é, seppur molto basica, una rete neurale.
Proviamo a visualizzarla in un'immagine dove i box arancioni sono i nodi di input e i rossi sono i nodi "nascosti" e temporanei.</p>
<p><img alt="rete2" src="../../../../../wp-content/uploads/2016/reteneurale2.jpg"></p>
<p>In una rete neurale (<em>neural networks</em>) abbiamo:</p>
<ul>
<li>
<p>i neuroni: la funzione di stima e i set di pesi;</p>
</li>
<li>
<p>le catene: i collegamenti fra neuroni che permettono di valutare il prezzo più volte.</p>
</li>
</ul>
<p>Nel prossimo <a href="../../../../../pescewanda/2016/11/11/machine-learning-PARTE2">post</a> cercherò di approfondire il concetto di rete neurale con degli esempi di applicazioni concrete.</p>
</div>
</div>
<aside class="postpromonav"><nav><h4>Categories</h4>
<ul itemprop="keywords" class="tags">
<li><a class="tag p-category" href="../../../../../categories/ai/" rel="tag">AI</a></li>
<li><a class="tag p-category" href="../../../../../categories/algoritmi-genetici/" rel="tag">algoritmi genetici</a></li>
<li><a class="tag p-category" href="../../../../../categories/genetic-algorithm/" rel="tag">Genetic algorithm</a></li>
<li><a class="tag p-category" href="../../../../../categories/neural-networks/" rel="tag">Neural networks</a></li>
<li><a class="tag p-category" href="../../../../../categories/pescewanda/" rel="tag">PesceWanda</a></li>
<li><a class="tag p-category" href="../../../../../categories/programming/" rel="tag">programming</a></li>
<li><a class="tag p-category" href="../../../../../categories/reti-neurali/" rel="tag">reti neurali</a></li>
</ul></nav></aside><p class="sourceline"><a href="index.md" class="sourcelink">Source</a></p>
<footer class="site-footer" id="footer"><span> CC BY-SA 4.0 International.<br></span>
<span class="site-footer-credits"><a href="https://getnikola.com">Nikola</a>, <a href="https://github.com/jasonlong/cayman-theme">Cayman theme</a>.</span>
</footer></section>
</div>
</body>
</html>