Q:
Wat is beter, een platform of een zelflerende machine learning-algoritme op AWS?
EEN:Tegenwoordig integreren veel bedrijven oplossingen voor machine learning in hun analysetool om merkbeheer te verbeteren, de klantervaring te verbeteren en de operationele efficiëntie te verhogen. Machine learning-modellen vormen de kerncomponent van oplossingen voor machine learning. Modellen worden getraind met behulp van wiskundige algoritmen en grote gegevenssets om betrouwbare voorspellingen te doen. Twee veelvoorkomende voorbeelden van voorspellingen zijn (1) bepalen of een reeks financiële transacties op fraude duidt of (2) het consumentensentiment rond een product beoordelen, op basis van input verzameld via sociale media.
Amazon SageMaker is een volledig beheerde service waarmee ontwikkelaars en datawetenschappers modellen voor machine learning kunnen bouwen, trainen en implementeren. In SageMaker kunt u out-of-the-box-algoritmen gebruiken of het zelf meenemen-pad kiezen voor een meer aangepaste oplossing. Beide keuzes zijn geldig en dienen even goed als basis voor een succesvolle machine learning-oplossing.
(Noot van de redactie: u kunt hier andere alternatieven voor SageMaker bekijken.)
De kant-en-klare algoritmen van SageMaker omvatten populaire, zeer geoptimaliseerde voorbeelden voor beeldclassificatie, verwerking van natuurlijke talen, enz. De volledige lijst is hier te vinden.
- Out-of-the-Box voordelen: deze algoritmen zijn vooraf geoptimaliseerd (en worden continu verbeterd). U kunt snel aan de slag gaan en worden ingezet. Plus, AWS automatische hyper-parameter tuning is beschikbaar.
- Out-of-the-Box overwegingen: De hierboven genoemde continue verbeteringen leveren mogelijk niet zo voorspelbaar resultaten op alsof u volledige controle had over de implementatie van uw algoritmen.
Als deze algoritmen niet geschikt zijn voor uw project, hebt u drie andere keuzes: (1) Amazon's Apache Spark Library, (2) aangepaste Python-code (die TensorFLow of Apache MXNet gebruikt) of (3) "zelf meenemen" waar u zijn in wezen onbeperkt, maar moeten een Docker-afbeelding maken om uw model te trainen en te bedienen (u kunt dit doen met behulp van de instructies hier ).
De Bring Your Own-benadering biedt u volledige vrijheid. Dit kan aantrekkelijk zijn voor datawetenschappers die al een bibliotheek met aangepaste en / of eigen algoritmische code hebben opgebouwd die mogelijk niet wordt weergegeven in de huidige out-of-the-box set.
- Bring-Your-Own Voordelen: maakt volledige controle over de gehele data science-pijplijn mogelijk, samen met het gebruik van proprietary IP.
- Overweeg overwegingen: Dockerisatie is vereist om het resulterende model te trainen en te bedienen. Het opnemen van algoritmische verbeteringen is uw verantwoordelijkheid.
Ongeacht de keuze van uw algoritme, SageMaker op AWS is een benadering die het overwegen waard is, gezien de nadruk die is gelegd op gebruiksgemak vanuit een data science-perspectief. Als u ooit hebt geprobeerd om een machine learning-project van uw lokale omgeving naar een gehoste te migreren, zult u aangenaam verrast zijn hoe naadloos SageMaker het maakt. En als je helemaal opnieuw begint, ben je al een aantal stappen dichter bij je doel, gezien hoeveel je al binnen handbereik hebt.