Q:
Hoe kunnen nieuwe mogelijkheden voor machinaal leren het stockeren van voorraaddocumenten voor financiële gegevens mogelijk maken?
EEN:Een van de opwindende nieuwe grenzen van machine learning en AI is dat wetenschappers en ingenieurs verschillende manieren gebruiken om volledig nieuwe soorten middelen te gebruiken om voorraadbewegingen en investeringsresultaten te voorspellen. Dit is een enorme game-wisselaar in de financiële wereld en zal op een zeer diepgaande manier een revolutie teweegbrengen in beleggingsstrategieën.
Een van de basisideeën voor het uitbreiden van dit soort aandelenonderzoek is computationele taalkunde, waarbij het modelleren van natuurlijke taal wordt gebruikt. Experts onderzoeken hoe tekstdocumenten kunnen worden gebruikt, van SEC-archieven tot brieven van aandeelhouders tot andere perifere op tekst gebaseerde bronnen, om voorraadanalyses te verbeteren of bij te stellen of om geheel nieuwe analyses te ontwikkelen.
Gratis download: machine learning en waarom het ertoe doet |
De belangrijke disclaimer is dat dit alles alleen mogelijk wordt gemaakt door nieuwe ontwikkelingen in neurale netwerken, machine learning en natuurlijke taalanalyse. Voorafgaand aan de komst van ML / AI, gebruikten computertechnologieën meestal lineair programmeren om ingangen te "lezen". Tekstdocumenten waren te ongestructureerd om bruikbaar te zijn. Maar met de vooruitgang die is geboekt in de analyse van de natuurlijke taal in de afgelopen jaren, ontdekken wetenschappers dat het mogelijk is om de natuurlijke taal te "minen" voor meetbare resultaten of, met andere woorden, resultaten die op een bepaalde manier kunnen worden berekend.
Enkele van de beste bewijzen en meest bruikbare voorbeelden hiervan komen uit verschillende proefschriften en doctoraatswerk dat op internet beschikbaar is. In een paper, "Toepassingen van machinaal leren en computerlinguïstiek in de financiële economie", gepubliceerd in april 2016, legt Lili Gao bekwaam relevante processen uit die specifiek zijn voor het ontginnen van bedrijfs SEC-dossiers, oproepen van aandeelhouders en berichten op sociale media.
"Het halen van betekenisvolle signalen uit ongestructureerde en hoogdimensionale tekstgegevens is geen gemakkelijke taak", schrijft Gao. "Met de ontwikkeling van machinaal leren en computationele linguïstische technieken kunnen de verwerking en statistiek analyseren van tekstuele documententaken echter worden uitgevoerd en vele toepassingen van statistische tekstanalyse in de sociale wetenschappen zijn succesvol gebleken." Uit Gao's bespreking van modellering en kalibratie in abstracto, laat het hele ontwikkelde document zien hoe sommige van deze analyses in detail werken.
Andere bronnen voor actieve projecten zijn pagina's zoals dit GitHub-projectoverzicht en deze IEEE-bron die specifiek spreekt over het verkrijgen van waardevolle financiële informatie uit "Twitter-sentimentanalyse".
Het komt erop neer dat het gebruik van deze nieuwe NLP-modellen leidt tot snelle innovatie bij het gebruik van allerlei tekstdocumenten, niet alleen voor financiële analyse, maar ook voor andere vormen van geavanceerde ontdekking, waardoor die traditioneel gevestigde grens tussen "taal" en "gegevens."