Q:
Waarom zijn enorme aantallen afbeeldingsbestanden belangrijk voor veel machine learning-projecten?
EEN:Voor bedrijven die willen deelnemen aan hun eerste investeringen in machine learning (ML), kan het hele proces een beetje cryptisch en esoterisch lijken. Voor veel mensen is het echt moeilijk om te visualiseren hoe machine learning daadwerkelijk werkt en wat het voor een bedrijf precies zal doen.
In sommige gevallen kan iemand die onderzoek doet naar machine learning een behoorlijk openbaring hebben als hij bedenkt waarom grote aantallen afbeeldingsbestanden, verzameld in nette digitale containers, zo belangrijk zijn voor ML-projecten. Dat komt omdat het concept "image file" helpt om ML te visualiseren. Als we hierover nadenken, kunnen we meer begrijpen over hoe dit soort technologieën zeer binnenkort op onze wereld zullen worden toegepast.
Gratis download: machine learning en waarom het ertoe doet |
Het korte antwoord is dat deze grote aantallen afbeeldingsbestanden belangrijk zijn voor machine learning omdat ze trainingssets vertegenwoordigen - sets van initiële gegevens waaraan de computer moet werken terwijl deze leert. Maar er is iets meer aan de hand dan dat. Waarom zijn afbeeldingen zo waardevol?
Een reden dat afbeeldingen zo waardevol zijn, is dat wetenschappers veel vooruitgang hebben geboekt in de beeldverwerking. Maar verder hebben ze ook vooruitgang geboekt bij het helpen van machines om uitkomsten te identificeren op basis van wat er op een foto staat.
Iedereen die bijvoorbeeld heeft gehoord over diepe koppige netwerken met zowel generatieve als discriminerende motoren, begrijpt een beetje hoe computers visuele gegevens en afbeeldingen kunnen lezen en begrijpen. Ze lezen de pixels niet meer zoals vroeger - ze zien de afbeelding eigenlijk en identificeren componenten. Denk bijvoorbeeld aan Facebook's gezichtsherkenning - de computer leert hoe u eruit ziet en identificeert u in foto's - evenals die om u heen. Dit wordt vaak mogelijk gemaakt door de verzameling van vele afbeeldingen en iteratieve training die de basis vormt voor een machine learning-project.
Wanneer de stakeholders een plan en concept hebben geïdentificeerd, en alle relevante afbeeldingen hebben verzameld en in de algoritmen voor machine learning hebben gestopt, kunnen ze de enorme kracht van kunstmatige intelligentie benutten om bedrijfsprocessen te runnen.
Een bedrijf kan een webcrawler op internet sturen op zoek naar afbeeldingen die een bepaalde klant kunnen bevatten, om een bestand samen te stellen met de identiteit van die klant en zijn of haar voorkeuren en neigingen. Het bedrijf kan deze informatie zelfs gebruiken om direct mail of andere direct marketing te automatiseren. Wanneer je er zo over begint te denken, is het gemakkelijk om te zien hoe alleen dat proces van beeldherkenning en identificatie kan worden gekoppeld aan allerlei functionaliteit waarmee computers zoveel dingen kunnen doen die mensen gewend zijn te doen voor al onze opgenomen geschiedenis. Als we het voorbeeld van klantonderzoek nemen, met de bovengenoemde typen instellingen, hoeven mensen er helemaal niet bij betrokken te zijn: de computer kan "op internet gaan" en verslag uitbrengen aan de eigenaars of de houders van de gegevens.
Voor iedereen die betrokken is bij het waden in de diepe wateren van machine learning, is het begrijpen van het concept van massabeeld datamining een goede eerste stap in een routekaart naar het benutten van machine learning kracht en het uitzoeken hoe het te gebruiken voor een onderneming.