Huis audio Sluit analyses overal in: de burgerwetenschapper in staat stellen

Sluit analyses overal in: de burgerwetenschapper in staat stellen

Anonim

Door Techopedia Staff, 25 augustus 2016

Takeaway: Host Rebecca Jozwiak bespreekt het fenomeen van embedded analytics en citizen data wetenschappers met Dr. Robin Bloor, Dez Blanchfield en David Sweenor.

Je moet je registreren voor dit evenement om de video te bekijken. Registreer om de video te bekijken.

Rebecca Jozwiak: dames en heren, hallo en welkom bij Hot Technologies. "Overal insluiten: de Citizen Data Scientist inschakelen" is vandaag ons onderwerp. Ik vul in voor je gebruikelijke gastheer, dit is Rebecca Jozwiak die invalt voor Eric Kavanagh. Ja, dit jaar is hot. Vooral de term 'data scientist' heeft veel aandacht gekregen, ook al noemden we ze saaie namen als 'statisticus' of 'analytics expert', die vrijwel hetzelfde soort activiteiten aanpakken, maar het heeft een sexy nieuwe naam en het is veel aandacht vergaren. Ze zijn zeer wenselijk om op de werkplek te hebben, gunstig voor de organisatie en iedereen wil er een. Maar ze zijn: 1) duur, 2) moeilijk te vinden. Weet je, het is al het nieuws over het gebrek aan vaardigheden van de datawetenschapper, ja, maar ze bieden nog steeds enorme waarde voor de organisatie en mensen schreeuwen een beetje hoe ze die waarde kunnen krijgen zonder het dubbeltje te laten vallen, dus om spreken.

Maar het goede nieuws is dat we hulpmiddelen en software zien uitkomen die dat tekort enigszins compenseren. We hebben automatisering, machine learning, embedded analytics, dat is waar we vandaag over gaan leren, en het is eigenlijk de aanleiding voor deze nieuwe term, 'de burgerwetenschapper', en wat betekent dat? Nee, het is niet uw getrainde datawetenschapper, het kan uw zakelijke gebruiker zijn, uw BI-expert, iemand van IT, iemand die wel de achtergrond heeft, maar misschien niet noodzakelijkerwijs de expertise. Maar wat het doet, deze tools en de software, is dat het meer mensen toegang geeft tot die slimme oplossingen, ook al kennen ze de diepe codering misschien niet. Maar het helpt gewoon de algehele prestaties te verbeteren als je iedereen een beetje meer toegang geeft tot die analytische gedachte. U hoeft de training niet per se te volgen om het soort nieuwsgierigheid te hebben dat kan leiden tot goede inzichten voor uw bedrijf.

We bespreken dat vandaag met ons, onze eigen Robin Bloor, hoofdanalist bij de Bloor Group, een van de ongrijpbare datawetenschappers zelf, Dez Blanchfield belt, en dan hebben we David Sweenor van Dell Statistica vandaag een presentatie voor ons. En daarmee geef ik het door aan Robin Bloor.

Robin Boor: Oké, bedankt voor die introductie. Ik heb hierover in een historische context gedacht. Waar we hier eigenlijk naar kijken is een van Leonardo da Vinci's ontwerpen voor een soort zweefvliegtuig dat een man op zijn rug kan leggen. Ik heb geen idee of het echt zou werken. Ik zou er niet op ingaan, moet ik zeggen. Maar da Vinci, als ik aan Da Vinci denk, beschouw ik hem als een van de meest nieuwsgierige en analytische mensen die ooit heeft bestaan. En het is vrij duidelijk als je alleen naar dat zweefvliegtuig kijkt dat het is ontworpen op basis van een vogelvleugel en hij op een of andere manier de vluchten van vogels heeft bestudeerd om het te bouwen.

Als we het historische perspectief nemen - ik heb dit eigenlijk opgezocht - is analyse misschien wel de oudste toepassing van wiskunde. Er zijn tellingen die dateren uit tenminste Babylonische tijden. We weten dit omdat er in principe enkele spijkerschrifttabellen zijn met dergelijke gegevens. Het is niet bekend of er iets was dat eerder terugging. Maar het voor de hand liggende is dat je een beschaving hebt met een grote populatie mensen, het vereist eigenlijk planning en het is de moeite waard om te weten waar je voor plant en wat de vereisten van die mensen eigenlijk zijn.

En dat is een soort van waar het begon en het is ook waar de computer begon, omdat de vroege computers, de vroege mechanische computers, eigenlijk waren, denk ik dat de eerste de volkstelling was, gecreëerd door Hollerith, die volgens mij IBM werd. Dit alles is vooruit gegaan. Er is een soort intermezzo geweest tussen misschien de jaren '70 en de dag van vandaag, waar er een groot aantal andere applicaties en analyses zijn, zou je kunnen zeggen, achterin zijn gaan zitten. Ja, er waren analyses aan de gang - het gebeurde in grote organisaties, met name banken en verzekeringsmaatschappijen, en eigenlijk General Electric en telco en dat soort dingen - maar het werd over het algemeen niet algemeen gebruikt en nu begint het overal in bedrijf. En het heeft het spel echt veranderd. Het eerste waar ik dacht de aandacht op te vestigen, is de datapiramide, die ik vooral leuk vind. Dit is, ik bedoel, ik tekende een van deze 20 jaar geleden - minstens 20 jaar geleden - om te proberen te begrijpen, echt, op dat moment probeerde ik BI te begrijpen en een deel van de vroege datamining die werd gedaan. Wat ik hier heb gedefinieerd, is het idee van gegevens en de voorbeelden zijn signalen, metingen, opnames, gebeurtenissen, transacties, berekeningen, aggregaties, individuele informatiepunten. Je zou ze kunnen beschouwen als moleculen van informatie, maar het zijn individuele punten. Het wordt informatie zodra het context krijgt. Gekoppelde gegevens, gestructureerde gegevens, databases, visualisatie van gegevens, plotters, schemers en ontologieën - ze kwalificeren allemaal in mijn gedachten als informatie omdat wat je hebt gedaan veel variatie samenvoegt en iets veel meer dan een gegevenspunt heeft gecreëerd, iets dat eigenlijk een vorm heeft, een wiskundige vorm.

Daarboven hebben we kennis. We kunnen, door informatie te onderzoeken, leren dat er verschillende patronen zijn en we kunnen die patronen benutten door regels, beleid, richtlijnen, procedures te formuleren, en dan neemt het de vorm aan van kennis. En vrijwel alle computerprogramma's, wat ze ook doen, zijn een soort kennis, omdat ze tegen gegevens werken en regels daarop toepassen. We hebben deze drie lagen en er vindt een toenemende verfijning plaats tussen de lagen. En aan de linkerkant van dit diagram ziet u nieuwe gegevens die binnenkomen, dus veel van deze dingen zijn statisch. De gegevens verzamelen zich, informatie verzamelt zich en kennis groeit mogelijk. Bovenaan hebben we 'begrip' en ik zou volhouden, hoewel het een filosofisch argument is, dat begrip alleen bij mensen ligt. Als ik het mis heb, worden we allemaal op een bepaald moment vervangen door computers. Maar in plaats van het debat te voeren, ga ik door naar de volgende dia.

Toen ik hiernaar keek, het interessante, dit is iets recents, het was interessant om te proberen erachter te komen wat analyse eigenlijk was. En uiteindelijk, door verschillende diagrammen te tekenen en te eindigen met een die er zo uitzag, kwam ik tot de conclusie dat de ontwikkeling van analyses eigenlijk alleen maar software-ontwikkeling is met een enorme hoeveelheid wiskundige formules. Analytische verkenning is een beetje anders dan softwareontwikkeling in de zin dat u eigenlijk heel veel verschillende modellen zou nemen en deze zou onderzoeken om nieuwe kennis over gegevens te genereren. Maar als je het eenmaal hebt gegenereerd, wordt het geïmplementeerd in wat ik beschouw als passieve beslissingsondersteuning, wat informatie is die net aan een gebruiker is gegeven; interactieve beslissingsondersteuning, zoals OLAP, waarbij de gebruiker een gestructureerde set gegevens krijgt die hij zelf kan onderzoeken en dingen kan afleiden met behulp van de verschillende beschikbare hulpmiddelen. Veel visualisatie is zo. En dan hebben we automatisering. Als u wat analytisch inzicht dat u hebt verzameld, kunt omzetten in een set regels die kunnen worden geïmplementeerd, hoeft u niet per se een mens te betrekken. Dat is het soort manier waarop ik ernaar keek toen ik dat allemaal deed. En verschillende dingen begonnen bij me op te komen. Eens een activiteitsgebied, laten we zeggen, als een datadomein daadwerkelijk is gedolven, grondig gedolven, grondig onderzocht in alle mogelijke richtingen, wordt het uiteindelijk gewoon gekristalliseerde BI. De kennis die is uitgevonden begint kennis te worden die verschillende gebruikers op verschillende manieren informeert, en verhoogt, hopelijk, hun vermogen om daadwerkelijk het werk te doen dat zij doen.

Een van de dingen die me opviel en ik heb ongeveer vijf jaar lang naar voorspellende analyses gekeken, maar voorspellende analyses worden BI, in de zin dat het alleen maar nuttige informatie wordt om aan mensen te voeden en zoals ik al heb aangegeven, er is geautomatiseerde BI-rapportage, BI explorative, BI, zeer verschillende gradaties ervan en voorspellende analyse gaat eigenlijk in alle drie de richtingen. En het analytische proces zoals ik heb aangegeven, is niet zo anders dan softwareontwikkeling, alleen gedaan door verschillende mensen met enigszins verschillende vaardigheden. Ik veronderstel dat ik moet benadrukken dat de vaardigheden die nodig zijn om een ​​echt goede datawetenschapper jaren te laten kosten om te verwerven. Ze zijn niet gemakkelijk te verwerven en niet een groot aantal mensen kan het, maar dat komt omdat het wiskunde op een zeer geavanceerd niveau moet begrijpen om te weten wat geldig is en wat niet geldig is. Analyse-ontwikkelingen, ontdekking van nieuwe kennis, analyse-implantatie, het gaat erom de kennis operationeel te maken. Dat is het soort achtergrond dat ik zie voor alle analyses. Het is een enorm gebied en er zijn veel, veel dimensies aan verbonden, maar ik denk dat generalisatie op alles van toepassing is.

Dan is er de bedrijfsverstoring, zoals ik al zei, er zijn een aantal organisaties, farmaceutische bedrijven zijn er nog een, die in hun DNA analyses hebben. Maar er zijn veel organisaties die het echt niet in hun DNA hebben, en nu hebben ze de mogelijkheid, nu zijn de software en de hardware veel goedkoper dan vroeger, nu hebben ze de mogelijkheid om het te exploiteren. Ik zou een aantal dingen zeggen. Het eerste is dat analytics in veel gevallen R&D is. U past misschien gewoon analyses toe op een specifiek gebied van de organisatie en het lijkt misschien alledaags dat u op een of andere manier de klantorders opnieuw vanuit verschillende perspectieven analyseert en combineert met andere gegevens. Maar analyse biedt eigenlijk de mogelijkheid om naar de organisatie als geheel te kijken en vrijwel elke specifieke activiteit die binnen de organisatie en hele activiteitenketens plaatsvindt, te analyseren. Maar als je dat gebied daadwerkelijk betreedt, zou ik volhouden dat het onderzoek en ontwikkeling is. En er is een vraag die me een paar keer is gesteld, namelijk: "Hoeveel moet een bedrijf uitgeven aan analyse?" En ik denk dat de beste manier om daarover een antwoord te geven is door analyse als R&D te beschouwen. en vraag gewoon: "Wel, hoeveel zou u uitgeven aan R&D op het gebied van de efficiëntie van het bedrijf?"

En de bedrijven die niet met analyses werken, zijn er veel dingen die ze niet weten. Allereerst weten ze niet hoe het moet. Normaal gesproken, als ze daadwerkelijk op een of andere manier analytics binnen de organisatie gaan gebruiken, hebben ze eigenlijk geen andere keus dan naar een adviesbureau te gaan dat hen daarbij kan helpen, omdat het voor de meeste mensen onmogelijk of heel moeilijk zou zijn bedrijven om een ​​datawetenschapper in dienst te nemen, er een te vinden, te betalen en erop te vertrouwen dat ze doen wat u wilt. Erg moeilijk. De meeste bedrijven weten niet hoe ze personeel moeten inhuren of opleiden om dit werk daadwerkelijk te doen, en de reden daarvoor is gewoon dat het nog niet in hun DNA zit, dus het maakt geen deel uit van hun natuurlijke bedrijfsprocessen. Dit gaat naar het volgende punt. Ze weten niet hoe ze er een bedrijfsproces van moeten maken. De beste manier om dat te doen, is trouwens door te kopiëren welke farmaceutische bedrijven en verzekeringsmaatschappijen, kijk maar, en sommige bedrijven in het gezondheidscentrum, gewoon kijken naar de manier waarop ze analyses gebruiken en kopiëren. Omdat het een bedrijfsproces is. Weet niet hoe het te controleren of te controleren. Dat echt, vooral nu heel veel softwarebedrijven producten hebben gemaakt die ontzettend veel analyses automatiseren. Het punt over auditing is belangrijk, wanneer je een adviesbureau of iemand op de site hebt die kan worden vertrouwd om te begrijpen wat de resultaten van een analytische berekening zijn, dat is een soort keuze die je moet maken, maar als je echt krachtige analytische tools in de handen van mensen die analytics niet goed begrijpen, zullen waarschijnlijk tot conclusies komen die misschien niet correct zijn. En zoals ik al zei, weten bedrijven niet hoe ze dit moeten budgetteren.

Dit zijn smaken van analyse, ik zal ze gewoon doornemen. Statistische analyses en statistische modellering verschillen aanzienlijk van voorspellende analyses, waarvan de meeste trouwens curve-fit zijn. Machine learning is anders dan die dingen, padanalyses en tijdreeksen, wat in principe wordt gedaan op statusstromen zijn weer anders. Grafiekanalyses zijn weer anders en tekstanalyses en semantische analyses zijn weer anders. Dit wijst er alleen maar op dat dit een zeer genre is. Het is niet zo, je begint niet met analyseren, je begint te kijken naar problemen die je hebt en zoekt naar de verschillende tools en verschillende smaken van analyses die daar bij passen. En tot slot, het netto-net. Vanwege hardware- en software-evolutie staat analyse naar mijn mening nog in de kinderschoenen. Er zal nog veel, veel meer komen en we zullen het de komende jaren zien ontvouwen. Ik denk dat ik nu de bal aan Dez kan geven.

Dez Blanchfield: Ja, praat over een moeilijke act om te volgen, Robin. Ik ga dit onderwerp kort bezoeken vanuit een van mijn favoriete hoeken, namelijk de hoek van de mens. Er vinden zoveel veranderingen plaats in ons dagelijks leven. Een van de grootste verstoringen in ons dagelijks leven, naar mijn mening, is gewoon alledaags werk. Op het werk verschijnen en proberen het werk te doen waarvoor je bent aangenomen, en de toenemende verwachting dat je van een gewoon persoon naar een superheld gaat en de hoeveelheid informatie die door organisaties stroomt en heel, heel snel uitzendt, het is een belangrijke uitdaging en steeds meer moeten we mensen betere en betere hulpmiddelen bieden om te proberen om te gaan met de stroom van kennis en informatie en dus dacht ik dat ik dit een beetje leuk zou proberen te doen . Maar het valt me ​​altijd op hoe we deze high mind of flash mobs hebben, enzovoort, die ons een soort van drijfveer maken naar waar we het over hebben als analyse, maar waar we het echt over hebben is het beschikbaar stellen van informatie aan mensen, en zodat ze ermee kunnen communiceren en het op een zodanige manier kunnen doen dat het natuurlijk is en het normaal aanvoelt.

En in feite doet het me denken aan een YouTube-video van een jong kind, kleine baby, zittend op de vloer en het zit daar te spelen met een iPad en het klappert rond en knijpt en knijpt en beweegt de beelden en speelt met het scherm, de gegevens daar. En dan neemt de ouder de iPad weg en legt een tijdschrift, een gedrukt tijdschrift op de schoot van het kind. En dit kind is waarschijnlijk niet meer dan twee jaar oud. Het kind begint te proberen met het scherm van het tijdschrift te vegen en knijpt en knijpt en het tijdschrift reageert niet. Het kind tilt zijn vinger op en kijkt ernaar en denkt: "Hmm, ik denk niet dat mijn vinger werkt", en het steekt zichzelf in de arm en denkt: "Ah nee, mijn vinger werkt, ik kan mijn arm voelen en dat ziet er goed uit, 'en het beweegt de vinger en de vinger beweegt en reageert. Ja. Dan probeert het weer met het tijdschrift te communiceren, en laag en zie, het knijpt niet en knijpt en scrolt niet. Dan nemen ze het tijdschrift weg en leggen de iPad weer op zijn schoot, en plotseling werkt het ding. En hier is een baby die is meegekomen en is opgeleid om een ​​analytisch hulpmiddel of een livestreamtool voor entertainment te gebruiken en het kan niet uitzoeken hoe een tijdschrift zou moeten werken en hoe pagina's om te slaan.

En dat is op zichzelf een interessant concept. Maar als ik denk aan kennis die zich in organisaties verplaatst, en de manier waarop gegevens stromen en de manier waarop mensen zich gedragen, denk ik vaak aan dit concept van wat mensen hebben geleerd een flashmob te zijn, een evenement waar en welke sociale media maakt dit is nog gemakkelijker te doen, een idee als zodanig dat je op deze tijd en datum en actie naar deze plek gaat, of video en leer deze dansen, of draag deze gekleurde hoed en wijs naar het noorden op één uur. En je duwt dit via je netwerk naar buiten, en steevast komen er een heleboel mensen, honderden van hen, op dezelfde plaats op hetzelfde moment en doen hetzelfde en er is deze wow-factor, deze, zoals: "Heilige koe, dat was echt indrukwekkend! ”Maar eigenlijk is het een heel simpel idee, en een simpel concept dat gewoon door onze netwerken wordt geduwd en we krijgen deze uitkomst die een visueel verbluffend en hoorbaar indrukwekkend iets is. En als je denkt aan een organisatie, de manier waarop we willen dat mensen zich gedragen en de manier waarop we willen dat ze omgaan met informatiesystemen en klanten, is het vaak zo eenvoudig, het is een idee of een concept of een culturele of gedragskenmerken die we proberen door te geven door en machtigen met hulpmiddelen en informatie.

En dat alles onderbouwt deze mantra die ik al meer dan tweeënhalve decennia heb en dat is, als uw medewerkers niet kunnen vinden wat ze nodig hebben om hun werk te doen, of het nu hulpmiddelen of informatie zijn, zullen ze steevast het wiel opnieuw uitvinden. En dus is dit een steeds grotere uitdaging nu, waar we veel kennis en veel informatie en dingen hebben die heel snel gaan, dat we willen voorkomen dat mensen het wiel opnieuw uitvinden. En als we nadenken over onze werkomgeving, terugkomend op de hoek van de mensen, wat een van mijn favorieten is, was ik verbaasd toen we verrast waren dat cabines geen gunstige omgeving waren voor goede resultaten, of we hebben dingen op een rij gezet zoals deze gruwelijke foto's hier, en het is niet veel veranderd, liet gewoon de muren zakken en noemde ze open werkruimtes. Maar in het midden met de gele lus om hen heen wisselen twee mensen kennis uit. En toch, als je naar de rest van de kamer kijkt, zitten ze daar allemaal plichtsgetrouw te bonzen en informatie op een scherm te zetten. En vaker wel dan niet, niet echt kennis en gegevens uitwisselen, en daar zijn verschillende redenen voor. Maar de interactie in het midden van de vloer links daar in de gele cirkel, er zijn twee mensen die daar chatten, kennis uitwisselen en waarschijnlijk proberen iets te vinden, proberen te zeggen: "Weet je waar dit rapport is, waar ik kan deze gegevens vinden, welk hulpmiddel gebruik ik om dit ding te doen? ”En het heeft waarschijnlijk niet gewerkt, dus ze hebben niets en dwaalden over de vloer, overtreden de regel van kantoorruimte in de kast en deden het persoonlijk.

En we hebben op kantoor soortgelijke omgevingen gehad waar we voor de grap plezier in hebben, maar de realiteit is dat ze behoorlijk krachtig en effectief zijn. En een van mijn favorieten is het mobiele of vaste analyseplatform genaamd de waterkoeler, waar mensen naar boven gaan en daar chatten en kennis uitwisselen, ideeën vergelijken en analyses uitvoeren terwijl ze bij de waterkoeler staan ​​en ideeën uitwisselen. Het zijn zeer krachtige concepten als je erover nadenkt. En als u ze kunt vertalen naar uw systemen en tools, krijgt u een verbluffend resultaat. En we hebben de favoriet van alle tijden, die in wezen de krachtigste datadistributiehub van het kantoor is, ook wel de receptie genoemd. En als je iets niet kunt vinden, waar ga je dan heen? Nou, je loopt naar de voorkant van het kantoor en je gaat naar de receptie en zegt: "Weet je waar x, y, z is?" En ik daag iedereen uit om me te vertellen dat ze dat niet minstens één keer hebben gedaan in een nieuwe baan of op een bepaald moment dat ze iets niet kunnen vinden. En je moet jezelf afvragen, waarom is dat zo? Het zou ergens op het intranet of een tool of wat dan ook moeten zijn. Het moet gemakkelijk te vinden zijn.

En dus als het gaat om data en analyse en de tools die we onze medewerkers hebben geboden om hun werk te doen en de manier waarop mensen omgaan met banen, heb ik het idee dat voorafgaand aan de recente opkomst van analyse-tools en big data-platforms, of 'gegevensverwerking', zoals het ook op de oude school wordt genoemd, rapportage en kennisuitwisseling was verre van dynamisch of collaboratief of open, en als je nadenkt over het soort systemen waarvan we verwachten dat mensen hun werk ermee doen, hadden we klassiek, wat mensen noemen het nu legacy, maar de realiteit is dat het alleen legacy is die er is en het is er vandaag nog steeds, en daarom is het niet echt legacy. Maar traditionele HR-systemen en ERP-systemen - human resource management, enterprise resource planning, enterprise data management en systemen die we gebruiken om de informatie te beheren om een ​​bedrijf te leiden. Het is altijd stil. En vanaf de bovenkant, eenvoudige platforms zoals afdelingsintranetten, die proberen te communiceren waar dingen zijn en hoe ze te krijgen en hoe te communiceren met de kennis overal. We zetten dat op ons intranet. Het is alleen zo goed als de mensen die tijd en moeite doen om dat daar te plaatsen, anders blijft het gewoon in je hoofd zitten. Of je hebt gegevens helemaal onderaan de voedselketen, bij de bedrijfs-SAN's en alles daartussenin, dus zijn opslaggebiednetwerken vol met bestanden en gegevens, maar wie weet waar het te vinden is.

Vaker wel dan niet hebben we deze gesloten dataplatforms of gesloten systemen gebouwd, en dus zijn mensen teruggekeerd naar spreadsheets en PowerPoints om informatie overal rond te geven. Maar er was iets interessants dat recentelijk plaatsvond, in mijn gedachten, en dat was dat mobiele apparaten en internet in het algemeen zo werken aan het idee dat dingen eigenlijk beter kunnen. En vooral in de consumentenruimte. En het is interessant dat we in het dagelijks leven dingen als internetbankieren begonnen te hebben. We hoefden niet fysiek naar een bank te gaan om met hen te communiceren, we konden het telefonisch doen. Oorspronkelijk was dat onhandig, maar toen kwam het internet en hadden we een website. Weet je, en hoe vaak ben je de laatste tijd echt bij je bank geweest? Ik kan het eigenlijk niet, ik had hier onlangs een gesprek over, en ik kan me eigenlijk de laatste keer dat ik naar mijn bank ging niet herinneren, waar ik behoorlijk geschrokken van was, ik dacht dat ik me dit moest kunnen herinneren, maar het was zo lang geleden kan ik me eigenlijk niet herinneren toen ik daarheen ging. En dus hebben we nu deze gadgets in de hand in de vorm van mobiele telefoons en telefoons, tablets en laptops, we hebben netwerken en toegang tot tools en systemen, en de consumentenruimte hebben we geleerd dat dingen beter kunnen, maar omdat van de snelle verandering in de consumentenruimte, die meer lethargische en glaciale veranderingen heeft ondergaan binnen ondernemingen en omgevingen, hebben we die verandering niet altijd doorgevoerd in het dagelijkse beroepsleven.

En ik hou ervan om plezier te maken met het feit dat je gegevens niet live naar hardcopy kunt streamen. In deze afbeelding hier zit een persoon die naar sommige analyses kijkt die zijn uitgevoerd, en er is een prachtige grafiek die is gemaakt door iemand die waarschijnlijk veel geld wordt betaald als een statisticus of een actuaris, en ze zitten daar en proberen analyses op een hardcopy en erin porren. Maar hier is het beangstigende voor mij: deze mensen in deze vergaderruimte, bijvoorbeeld, en ik gebruik dit als een voorbeeld, ze communiceren met gegevens die nu historisch zijn. En het is zo oud vanaf het moment dat dat ding werd geproduceerd en vervolgens afgedrukt, dus misschien is het een week oud rapport. Nu nemen ze beslissingen over niet zozeer slechte gegevens, maar oude gegevens, wat altijd slechte gegevens kunnen zijn. Ze nemen vandaag een beslissing op basis van iets dat historisch is, wat echt een slechte plek is om te zijn. We hebben die hardcopy kunnen vervangen door tablets en telefoons, omdat we heel snel hebben gewerkt in de consumentenruimte, en nu hebben we het uitgewerkt in de bedrijfsruimte, dat realtime inzichten realtime waarde is.

En daar worden we steeds beter in. En het brengt me op het punt dat Robin eerder aan de orde heeft gesteld, dat was het concept van de burgerwetenschapper en de drijfveer van dit concept. Voor mij is een burgerwetenschapper gewoon gewone mensen met de juiste tools en informatie over bijvoorbeeld een iPad. Ze hoeven de wiskunde niet uit te voeren, ze hoeven de algoritmen niet te kennen, ze hoeven niet te weten hoe ze de algoritmen en regelgegevens moeten toepassen, ze moeten alleen weten hoe de interface te gebruiken. En dat brengt me terug bij mijn inleiding en het concept van de peuter die daar zit met een iPad versus een tijdschrift, versus een iPad. De peuter kan heel snel, intuïtief leren hoe de interface van een iPad te gebruiken om in informatie te duiken en ermee te communiceren, zij het misschien een spel of streaming media of een video. Maar het kon niet dezelfde reactie of interactie krijgen van een tijdschriftbalk en gewoon pagina na pagina flitsen, wat niet erg aantrekkelijk is, vooral als je een peuter bent die is opgegroeid met iPads. Mensen kunnen onveranderlijk snel kijken en leren hoe ze met hulpmiddelen en dingen kunnen werken die, als we ze alleen maar bieden, en als we ze een interface bieden zoals mobiele apparaten en met name tablets en smartphones met voldoende grote schermen, en vooral als je kunt communiceren ze in aanraking, met vingerbewegingen, krijg je ineens dit concept van een burgerwetenschapper.

Iemand die data science met de juiste tools kan toepassen, maar zonder echt te weten hoe het te doen. En in mijn gedachten werd veel hiervan, zoals ik zei, gedreven door consumenteninvloed, die bewoog en veranderde in vraag en onderneming. Een paar heel snelle voorbeelden. Wij, velen van ons, zouden dingen gaan doen met onze blogs en websites, zoals kleine advertenties plaatsen of kijken naar tracking en beweging, we gebruikten tools zoals Google Analytics en we werden gewekt door het feit dat in onze blogs en kleine websites, we kunnen er kleine stukjes code in stoppen en Google zou ons realtime inzicht geven in wie de website bezoekt, wanneer en waar en hoe. En in realtime konden we mensen zien die op de website kwamen, door de pagina's bladeren en dan verdwijnen. En het was behoorlijk verbazingwekkend. Ik vind het nog steeds leuk om dat te doen, wanneer ik probeer om real-time analyses aan mensen uit te leggen, dom ik het gewoon op om hen een website te laten zien met Google Analytics aangesloten, en zie de live interactie met mensen die websites raken en vraag hen: "Stel je voor als u had dat soort inzichten in uw bedrijf in realtime. "

Neem een ​​voorbeeld in de detailhandel, en misschien een farmaceutisch, ik denk dat je het een drogisterij in Amerika noemt, een apotheek waar je binnenkomt en alles koopt, van hoofdpijntabletten tot zonnebrandcrème en hoeden. Proberen die organisatie te runnen zonder realtime informatie is een eng concept nu we weten wat we weten. Je kunt bijvoorbeeld voetverkeer meten, apparaten in de winkel plaatsen met een smiley aan de ene kant van het scherm omdat je gelukkig bent, en een ongelukkig rood aan de rechterkant en verschillende tinten in het midden. En er is tegenwoordig een platform genaamd 'Happy or Not', waar je een winkel binnenloopt en je een blij gezicht of een droevig gezicht kunt knallen, afhankelijk van je live feedback van het klantensentiment. En dat kan interactief zijn met realtime. U kunt live vraaggestuurde prijzen krijgen. Als het daar veel mensen is, kun je de prijzen een beetje verhogen, en je kunt de beschikbaarheid van de voorraad doen en bijvoorbeeld mensen vertellen - luchtvaartmaatschappijen zullen bijvoorbeeld mensen vertellen hoeveel zitplaatsen er nu beschikbaar zijn op de website wanneer je boekt u een vlucht, u belt niet zomaar willekeurig in en hoopt dat u kunt verschijnen en een vlucht kunt nemen. Live HR-gegevens, u kunt zien wanneer mensen aan en uit klokken. Inkoop, als u in inkoop bent en u beschikt over live gegevens, kunt u dingen doen zoals een uur wachten en zich indekken tegen de prijs van de Amerikaanse dollar om uw volgende lading voorraad te kopen en een vrachtwagen vol dingen te laten verschijnen.

Wanneer ik mensen Google Analytics laat zien en ik dat soort anekdote, dit eureka-moment, dit "a-ha!" -Moment doorgeven, gaat deze gloeilamp uit hun hoofd als: "Hmm, ik kan veel plaatsen zien waar ik dat kan doen . Had ik maar de tools en als ik maar toegang had tot die kennis. ”En we zien dit nu op sociale media. Iedereen die een slimme sociale media-gebruiker is, behalve alleen foto's van hun ontbijt laten zien, heeft de neiging om te kijken hoeveel likes ze krijgen en hoeveel verkeer ze krijgen en hoeveel vrienden ze krijgen, en dat doen ze met de houdt van bijvoorbeeld Twitter als analyse-instrument. Je kunt naar Twitter.com gaan om de tool te gebruiken, maar je typt in Google Twitter Analytics dot com, of klik op de knop rechtsboven en open het menu en doe het, je krijgt deze mooie, live grafieken die je vertellen hoeveel tweets die je zelf doet en hoeveel interacties ermee. En realtime analyses alleen op uw persoonlijke sociale media. Stel je voor dat we zoals Google Analytics en Facebook en LinkedIn en Twitter, eBay-statistieken naar je toekomen, maar in je werkomgeving.

Nu hebben we het live soort web en mobiel binnen handbereik, het wordt een powerconcept. En dat trekt mij tot mijn conclusie, en dat is dat ik steevast heb vastgesteld dat organisaties die hulpmiddelen en technologie al vroeg gebruiken, zo'n aanzienlijk voordeel behalen ten opzichte van hun concurrenten dat concurrenten ze misschien nooit inhalen. En dat zien we nu met het conflict van burger data-wetenschapper. Als we mensen kunnen meenemen met de vaardigheden, de kennis waarvoor we hen hebben ingehuurd, en we kunnen ze de juiste tools geven, met name de mogelijkheid om real-time gegevens te bekijken en gegevens te ontdekken en te weten waar het zich bevindt zonder rond te lopen in de cellen en stel hardop vragen, terwijl je bij de waterkoeler moet gaan staan ​​om wat vergelijkende analyses met mensen te maken of ga naar de receptie waar de index is. Als ze dat binnen handbereik kunnen doen en ze kunnen meenemen naar hun vergaderingen met hen en in een bestuurskamer in realtime door schermen bladeren in plaats van hardcopy, hebben we ineens onze medewerkers gemachtigd die niet actueel hoeven te zijn data wetenschappers, maar om data science daadwerkelijk te gebruiken en geweldige resultaten voor organisaties te genereren. En ik denk dat dit omslagpunt dat we nu echt zijn gepasseerd, waar de consument het bedrijf in wordt gedreven, de uitdaging is hoe we die onderneming kunnen bieden, en dat is het thema dat ik denk in de discussie van vandaag. En daarmee ga ik mijn stuk inpakken en overhandigen om te horen hoe we dat kunnen oplossen. David, naar jou toe.

David Sweenor: Oké, heel erg bedankt jongens, en bedankt Robin. Weet je, Robin, ik ben het eens met je oorspronkelijke beoordeling. Analytisch proces, het is eigenlijk niet anders dan softwareontwikkeling. Ik denk dat de uitdaging binnen een organisatie gewoon echt is, weet je, misschien zijn dingen niet zo goed gedefinieerd, misschien zit er een verkennende component in, en een creatieve component erin. En Dez, weet je, ik ben het met je eens, er is veel het wiel opnieuw uit te vinden, en weet je, er is geen organisatie waar ik vandaag op inga, je vraagt ​​je af, nou, waarom doe je het op deze manier? Waarom loopt het bedrijf zo? En het is gemakkelijk om vragen te stellen, en vaak als je binnen een organisatie bent, is het moeilijk om te veranderen. Ik hou van de analogie, de consumentisering van dingen. En dus niet meer wanneer ik naar het vliegveld ga en van stoel wil veranderen - ik doe het op mijn mobiel. Ik hoef niet naar de agent bij de stand te gaan en te kijken hoe die agent 15 minuten lang iets op een monochrome monitor typt om mijn stoeltoewijzing te wijzigen. Ik doe het gewoon liever op mijn telefoon, en dus is het een interessante ontwikkeling.

Vandaag gaan we het hebben over collectieve intelligentie. Voor degenen die het niet weten, is Statistica een toonaangevend analyseplatform dat al meer dan 30 jaar bestaat. Als u naar een van de publicaties in de analistenbranche kijkt, komt deze altijd bovenaan als een van de meest intuïtieve en eenvoudig te gebruiken geavanceerde analysesoftwarepakketten. Dus hebben we de afgelopen jaren gewerkt aan een concept dat collectieve intelligentie wordt genoemd, en we brengen het naar een volgend niveau. Ik wilde dit gesprek beginnen met: hoe wordt het werk gedaan in uw organisatie?

En er zijn hier twee afbeeldingen. De foto links is een afbeelding uit de jaren zestig en ik ben mijn carrière niet begonnen in de jaren zestig, maar de afbeelding rechts is - dat is een halfgeleiderfabriek waar ik begon te werken. En ik werkte op in dat zwarte gebouw, het zwarte dak linksboven. Maar ze maakten halfgeleider dingen. Dit is een recente foto van Google Afbeeldingen. Maar als je teruggaat naar de afbeelding uit de jaren zestig aan de linkerkant, is het erg interessant. Je hebt deze mensen in een rij en ze maken, weet je, geïntegreerde schakelingen en halfgeleiders. Maar er is een standaardisatie, er is een standaardmanier om dingen te doen en er was een goed gedefinieerd proces. Weet je, misschien omdat deze mensen allemaal in een open omgeving zitten, was er misschien een samenwerking. Ik denk dat we dat een beetje hebben verloren binnen het kenniswerkersbestand.

Toen ik in dat gebouw linksboven zat, als ik met iemand wilde samenwerken, was het niet open. Er waren deze kantoren, misschien was een deel van het team afgelegen, of misschien moest ik over deze campus trekken; het was 25 minuten lopen en ik moest met iemand in het gebouw aan de rechterkant gaan praten. Ik denk dat we onderweg iets verloren hebben. En dus, weet je, ik had dezelfde gedachte, waarom doen mensen - hoeveel mensen blijven het wiel opnieuw uitvinden binnen uw organisatie? Ik denk dat, weet u, organisaties als geheel goed werk hebben geleverd in de jaren 1990 en 2000 met CRM en datawarehousing, en tot op zekere hoogte BI. Om een ​​of andere reden is de analyse een beetje achtergebleven. Er werden aanzienlijke investeringen gedaan in datawarehousing en standaardisatie en normalisatie van uw gegevens, en dit alles, en CRM, maar de analyse is om een ​​of andere reden achtergebleven. En ik vraag me af waarom. Misschien is er een creatief - misschien is uw proces niet goed gedefinieerd, misschien weet u niet welke beslissing of hefboom u probeert te nemen, weet u, in uw bedrijf om dingen te veranderen. Als we vandaag organisaties ingaan, doen veel mensen dingen heel handmatig in spreadsheets.

En weet je, ik heb vanmorgen naar een stat gekeken, ik denk dat 80, 90 procent van de spreadsheets fouten bevat, en sommige hiervan kunnen erg belangrijk zijn. Zoals die in Whale, waar JPMorgan Chase miljarden en miljarden dollars verloor vanwege spreadsheetfouten. Ik denk dus dat er een betere manier moet zijn om dingen voor elkaar te krijgen. En zoals we al zeiden, hebben we deze datawetenschappers. Deze jongens zijn duur en moeilijk te vinden. En soms zijn ze een beetje een vreemde eend. Maar ik denk, weet je, als ik moet samenvatten wat een datawetenschapper is, is het waarschijnlijk iemand die de data begrijpt. Ik denk dat het iemand is die de wiskunde begrijpt, iemand die het probleem begrijpt. En echt iemand die de resultaten kan communiceren. En als je een datawetenschapper bent, heb je tegenwoordig veel geluk, omdat je salaris de afgelopen jaren waarschijnlijk is verdubbeld.

Maar de waarheid is dat veel organisaties deze datawetenschappers niet hebben, maar uw organisatie heeft slimme mensen. Je hebt een organisatie, je hebt veel slimme mensen en ze gebruiken spreadsheets. Weet je, statistieken en wiskunde zijn niet hun primaire taak, maar ze gebruiken gegevens om het bedrijf vooruit te helpen. Echt, de uitdaging die we aangaan is, hoe ga je, als je geluk hebt een datawetenschapper of een statisticus of twee te hebben, hoe kun je ze aangaan, en hoe kun je de samenwerking tussen die mensen en de andere personen binnen uw organisatie? Als we kijken naar hoe onze organisatie is gestructureerd, ga ik beginnen en ga ik van rechts naar links. En ik weet dat dit achteruit is, maar we hebben deze lijn van zakelijke gebruikers.

Dit is het grootste deel van uw kenniswerkerspopulatie en voor deze mensen moet u analyses in uw bedrijfstoepassingen opnemen. Misschien zien ze analytische output op een callcenterscherm of zo, en het vertelt hen het volgende beste aanbod om aan een klant te geven. Misschien is het een consument of leverancier op een webportaal en geeft het hen meteen krediet, of dat soort dingen. Maar het idee is dat ze analyses gebruiken. Als we naar het midden gaan, zijn dit deze kenniswerkers. Dit zijn de mensen die tegenwoordig dingen met de spreadsheets doen, maar spreadsheets zijn foutgevoelig en op een gegeven moment raken ze zonder benzine. Deze burgerwetenschappers, zoals we ze noemen, weet je, wat we voor hen proberen te doen, is echt het automatiseringsniveau verhogen.

En u hoort met analyses dat 80 tot 90 procent van het werk in het gegevensvoorbereidingswerk zit, en het is niet de feitelijke wiskunde, maar het is de gegevensvoorbereiding. We proberen dat te automatiseren, of u dat nu doet, en we hebben wizards en sjablonen en herbruikbare dingen, en u hoeft niet echt kennis te hebben van de onderliggende infrastructuur in uw omgeving. En als we dan uiterst links kijken, hebben we deze datawetenschappers. En zoals ik al zei, ze zijn schaars. En wat we proberen te doen om ze productiever te maken, is hen in staat te stellen dingen te maken die deze burgers met gegevenswetenschappers kunnen doen. Zie het als een Lego-blok, zodat deze datawetenschappers een herbruikbaar activum kunnen creëren dat een datawetenschapper van de burger kan gebruiken. Bouw het een keer, zodat we het wiel niet steeds opnieuw hoeven uit te vinden.

En dan kunnen deze jongens zich ook zorgen maken als we dingen in de database kunnen doen en gebruik kunnen maken van de bestaande technologische investeringen die uw bedrijf heeft gedaan. Weet je, het heeft tegenwoordig geen zin om gegevens over de hele wereld heen en weer te schudden. Dus als we naar Statistica kijken, zoals ik al zei, is het een platform dat al heel lang bestaat. En het is een zeer innovatief product. Gegevens blending, er is geen gegevensbron geweest waartoe we geen toegang hebben. We hebben alle dingen voor gegevensontdekking en visualisatie die u zou verwachten; we kunnen het in realtime doen. En dat is waarschijnlijk het geval - ik denk dat er meer dan 16.000 analytische functies in de softwaretool zitten, dus dat is meer wiskunde dan ik ooit zou kunnen gebruiken of begrijpen, maar het is er als je het nodig hebt.

We hebben de mogelijkheid om zowel bedrijfsregels als analytische workflows te combineren om echt een zakelijke beslissing te nemen. Je gaat verder dan alleen, hier is een algoritme, hier is een workflow, maar je hebt bedrijfsregels waarmee je altijd te maken hebt. We zijn erg veilig in governance. We worden gebruikt in veel farmaceutische klanten, omdat de FDA ons vertrouwt. Weet u, gewoon bewijs in de pudding dat we de controles en auditmogelijkheden hebben om door hen te worden geaccepteerd. En ten slotte, weet je, we zijn open en flexibel en uitbreidbaar, dus je moet een platform creëren dat is dat je wilt dat je datawetenschappers productief zijn, je wilt dat je burgerdatawetenschappers productief zijn, je wilt in staat zijn om deze analytische output in te zetten bij de werknemers binnen uw organisatie.

Als we er naar kijken, is hier een voorbeeld van enkele visualisaties. Maar uw analytische output kunnen distribueren naar zakelijke gebruikers, dus het eerste voorbeeld links, dat is een analytisch netwerkdiagram. En misschien ben je een onderzoeker van fraude en weet je niet hoe deze verbindingen tot stand worden gebracht, en dit kunnen mensen zijn, dit kunnen entiteiten zijn, dit kunnen contracten zijn, eigenlijk alles. Maar je kunt dit met je muis manipuleren en ermee communiceren om echt te begrijpen - als je een fraudeonderzoeker bent, om een ​​lijst met prioriteiten te begrijpen van wie je moet onderzoeken, juist, omdat je niet met iedereen kunt praten, dus je hebt om prioriteiten te stellen.

Als we naar de afbeelding rechts kijken, voor een voorspellend onderhoudsdashboard, is dit een heel interessant probleem. Misschien bent u een eigenaar van een luchthaven en hebt u deze bodyscanners daar. Deze bodyscanners, als u naar een luchthaven gaat, bevatten enkele componenten die ongeveer negen maanden houdbaar zijn. En deze dingen zijn echt, echt duur. Als ik meerdere toegangspunten, meerdere scanners op mijn luchthaven heb, nummer één, wil ik ervoor zorgen dat ik voldoende bemand ben aan elk van de poorten, en voor de onderdelen die in de scanners zitten, wil ik ze ook niet bestellen vroeg, en ik wil ze hebben voordat het kapot gaat. We hebben de mogelijkheid, misschien als u een luchthaven bezit, om te kunnen voorspellen wanneer deze dingen zullen breken en het personeelsniveau te voorspellen.

Als we rechtsonder kijken, is dit als u zich in een productieomgeving bevindt, dit is slechts een grafische weergave van de productiestroom. En het is enigszins moeilijk te zien, maar er zijn rode en groene verkeerslichten op deze verschillende processectoren, en dus als ik een ingenieur ben, is daar heel geavanceerde wiskunde aan de hand, maar ik kan inzoomen op die specifieke processector en kijken naar de parameters en invoer die dit mogelijk uit de hand loopt. Als we kijken naar onze burgergegevenswetenschapper, is ons doel echt om het de burgergegevenswetenschapper gemakkelijk te maken. We hebben wizards en sjablonen, en één ding vind ik echt interessant, is dat we dit geautomatiseerde knooppunt voor gegevenscontrole hebben. En echt wat dit doet, het heeft ingebouwde smarts.

Ik noemde gegevensvoorbereiding - het kost veel tijd, zowel bij het verzamelen van gegevens als bij het voorbereiden ervan. Maar laten we aannemen dat ik mijn gegevens heb, ik kan het door dit knooppunt voor gegevensgezondheidscheck voeren en het controleert op invariantie en spaarzaamheid en uitschieters, en al deze dingen, het vult ontbrekende waarden in en het doet veel wiskunde dat ik niet begrijp het niet, dus ik kan de standaardwaarden accepteren, of als ik een beetje slimmer ben, kan ik ze wijzigen. Maar het punt is dat we dat proces willen automatiseren. Dit ding doet ongeveer 15 verschillende controles en resultaten op een opgeschoonde gegevensset. Wat we doen, is het voor mensen gemakkelijker maken om deze workflows te maken.

Dit is waar we het hebben over samenwerking tussen de datawetenschappers en de burgerwetenschappers. Als we deze afbeeldingen aan de rechterkant bekijken, zien we deze workflow voor het voorbereiden van gegevens. En misschien is dit zeer geavanceerd, misschien is dit de geheime saus van uw bedrijf, ik weet het niet, maar we weten dat iemand binnen uw organisatie toegang heeft tot een of meer van deze datasilo's die we hebben. We hebben een manier nodig om, nummer één, ze te pakken en aan elkaar te naaien, en nummer twee, misschien is er een speciale verwerking die we willen doen, dat dit buiten onze controle van de gegevensgezondheid valt en dat is de geheime saus van uw bedrijf. Ik kan deze workflow binnen onze organisatie maken en het stort in als een knooppunt. Je ziet de pijl naar beneden wijzen, het is gewoon een knooppunt, en we kunnen honderd van deze dingen binnen een organisatie hebben. Het idee is dat we mensen hebben die iets van een bepaalde ruimte weten, ze kunnen een workflow creëren en iemand anders kan die hergebruiken. We proberen de heruitvinding van het wiel te minimaliseren.

En we kunnen hetzelfde doen met workflows voor analytische modellering. In dit geval aan de rechterkant, deze workflow, misschien zijn er 15 verschillende algoritmen en ik wil de beste kiezen voor de taak. En ik hoef niet te begrijpen als een burgerwetenschapper wat er daar aan de hand is in die spinnenwebtroep, maar het stort gewoon in een knooppunt in, en misschien zegt dat knooppunt gewoon: "bereken de kredietrisicoscore." "Bereken de kans van een chirurgische site-infectie, "wat heb je. "Bereken de waarschijnlijkheid dat iets een frauduleuze transactie is." Als burgergegevenswetenschapper kan ik deze zeer geavanceerde wiskunde gebruiken die iemand anders heeft gebouwd, misschien een van deze gegevenswetenschappers in mijn organisatie.

Vanuit een data science-perspectief, weet je, ik heb gesproken met datawetenschappers die ervan houden om code te schrijven, en ik heb gesproken met datawetenschappers die een hekel hebben aan code schrijven. En dat is prima, dus we hebben een zeer visuele, grafische gebruikersinterface. We kunnen onze gegevens verzamelen, we kunnen onze geautomatiseerde gegevenscontrole uitvoeren en misschien wil ik code schrijven. Ik hou van Python, ik hou van R, maar het idee is dat deze datawetenschappers schaars zijn en de code in een bepaalde taal leuk vinden. We hebben niet echt een voorkeur voor welke taal je wilt coderen, dus als je R wilt doen, doe dan R; als je Python wilt doen, doe dan Python. Dat is geweldig. Als u uw analyses naar Azure wilt laten barsten, moet u uw analyses naar de cloud laten barsten. En dus is het doel hier echt om flexibiliteit en opties te bieden om uw datawetenschappers zo productief mogelijk te maken.

Nu, datawetenschappers, het zijn behoorlijk slimme mensen, maar misschien zijn ze geen specialist in alles, en misschien zijn er wat lacunes in wat ze kunnen doen. En als u binnen de branche kijkt, zijn er veel verschillende analytische marktplaatsen die er zijn. Dit is een voorbeeld van, misschien moet ik beeldherkenning doen en die vaardigheid heb ik niet, maar misschien ga ik naar Algorithmia en krijg ik een beeldherkenningsalgoritme. Misschien ga ik naar Apervita en krijg ik een heel speciaal gezondheidsalgoritme. Misschien wil ik iets gebruiken in de Azure machine learning-bibliotheek. Misschien wil ik iets gebruiken in het native Statistica-platform.

Nogmaals, het idee hier is dat we de wereldwijde analysecommunity willen benutten. Omdat je niet over alle vaardigheden binnen je vier muren beschikt, dus hoe kunnen we software maken - en dit is wat we doen - waarmee je gegevenswetenschappers algoritmen van verschillende marktplaatsen kunnen gebruiken. We doen het al lang met R en Python, maar dit breidt dat uit naar deze app-marktplaatsen die er zijn. En hetzelfde dat je hier bovenop ziet, we gebruiken H2O op Spark, dus daar zijn veel analytische algoritmen. Je hoeft je niet te concentreren op het maken van deze helemaal opnieuw, laten we deze hergebruiken die in de open source-community leven, en we willen dat deze mensen zo productief mogelijk zijn.

De volgende stap, nadat we onze data-wetenschappers en onze data-wetenschappers hebben, is echt hoe promoot u en verspreidt u deze best practices? We hebben technologie in onze software waarmee u analyses overal kunt distribueren. En dit is meer een weergave van modelbeheer, maar ik ben niet langer gebonden aan de vier muren of een specifieke installatie in Tulsa of Taiwan of Californië, of wat dan ook. Dit is een wereldwijd platform en we hebben heel veel klanten die worden gebruikt voor meerdere sites.

En dus echt, de belangrijkste dingen zijn, als je iets doet in Taiwan en je wilt het repliceren in Brazilië, dat is geweldig. Ga naar binnen, pak de herbruikbare sjablonen, pak de workflows die je wilt. Dit probeert die normen te creëren, en de gebruikelijke manier om dingen te doen, dus we doen dingen niet overal helemaal anders. En het andere belangrijke onderdeel hiervan is dat we echt de wiskunde willen brengen naar waar de gegevens leven. Je hoeft geen gegevens te schudden tussen, je weet wel, Californië en Tulsa en Taiwan en Brazilië. We hebben technologie waarmee we de wiskunde naar de gegevens kunnen brengen, en we gaan een nieuwe Hot Technology-webcast over dat onderwerp hebben.

Maar we noemen deze architectuur, en hier is een voorproefje, Native Distributed Analytics Architecture. Het belangrijkste idee hierachter is dat we een platform hebben, Statistica, en dat ik een analytische workflow als atoom kan exporteren. En ik zou een model kunnen doen, of een volledige workflow, dus dat geeft niet. Maar ik kan dit maken en exporteren in een taal die geschikt is voor het doelplatform. Aan de linkerkant hiervan doen veel mensen dit, maar ze scoren in het bronsysteem. Dat is prima, we kunnen scoren en we kunnen modelbouw doen in de database, dus dat is interessant.

En dan aan de rechterkant, hebben we Boomi. Dit is een begeleidende technologie, we werken met al deze. Maar we kunnen deze workflows ook meenemen en in wezen overal ter wereld transporteren. Alles dat een IP-adres heeft. En ik hoef geen Statistica op de publieke of private cloud te installeren. Alles wat een JVM kan uitvoeren, we kunnen deze analytische workflows, data prep workflows of alleen modellen op elk van deze doelplatforms uitvoeren. Of het nu in mijn publieke of private cloud is, of het nu in mijn tractor, mijn auto, mijn huis, mijn gloeilamp, mijn internet van dingen is, we hebben technologie waarmee u die workflows overal ter wereld kunt transporteren.

Laten we eens kijken. Weet je, we hebben een lijn van zakelijke gebruikers, dus deze mensen, we hebben technologie waarmee ze output kunnen consumeren in een indeling waar ze vertrouwd mee zijn. We hebben gegevenswetenschappers van burgers, en wat we proberen te doen is de samenwerking verbeteren, ze deel laten uitmaken van een team, toch? En dus willen we dat mensen stoppen met het wiel opnieuw uitvinden. En we hebben deze datawetenschappers, er kan daar een vaardigheidskloof zijn, maar ze kunnen coderen in een taal die ze willen, ze kunnen naar de analytische markten gaan en daar algoritmen gebruiken. En dus, hoe kun je hiermee niet denken dat alles hier geweldig is? Dit is perfect, dit is wat we doen. We bouwen herbruikbare workflows, we geven mensen instructies, we geven ze de Lego-blokken zodat ze deze machtige kastelen kunnen bouwen en wat ze ook willen doen. Kortom, we hebben een platform dat de lijn van zakelijke gebruikers, burgerdatawetenschappers, programmeur datawetenschappers machtigt, we hebben - we kunnen elk soort IoT edge-analytics use case aanpakken, en we staan ​​dit idee van collectieve intelligentie toe. Daarmee denk ik dat we het waarschijnlijk voor vragen zullen openstellen.

Robin Bloor: Nou oké. Ik denk dat de eerste - ik bedoel, om eerlijk te zijn, ik ben eerder door Dell Statistica op de hoogte gebracht, en om eerlijk te zijn, ben ik eigenlijk behoorlijk verrast over de dingen die ik niet wist die je in de presentatie ter sprake bracht . En ik moet zeggen dat het één ding, het is iets dat voor mij een beest is geweest bij het gebruik van analyses, is dat, weet je, het krijgen van de tools, is het niet, weet je? Er zijn ontzettend veel tools die er zijn, open source tools, enzovoort, en er zijn verschillende, wat ik zou noemen, semi-platforms. Maar ik denk dat het verschil dat je hebt, ik vooral onder de indruk was van een deel van de workflow.

Maar het verschil is dat je end-to-end lijkt te bieden. Het is alsof analyse een geavanceerd bedrijfsproces is dat begint met het verzamelen van gegevens en vervolgens een hele reeks stappen doorloopt, afhankelijk van hoe schilferig de gegevens zijn, en dan kan het zich uitbreiden in een hele reeks verschillende wiskundige aanvallen op de gegevens. En dan komen op een of andere manier resultaten naar voren en dat moeten acties zijn. Ik ben ontzettend veel analyses tegengekomen waar veel goed werk is verricht, maar er is geen actie voor nodig. En je lijkt heel veel te hebben van wat nodig is. Ik weet niet hoe uitgebreid het is, maar het is veel uitgebreider dan ik had verwacht. Daar ben ik ongelooflijk van onder de indruk.

Ik wil graag dat u commentaar geeft op spreadsheets. Je hebt al iets gezegd, maar een van de dingen die ik heb opgemerkt en die ik in de loop van de jaren heb opgemerkt, maar het wordt steeds duidelijker, is dat er ontzettend veel spreadsheets zijn die schaduwsystemen zijn en echt denk ik de spreadsheet, ik bedoel, het was een geweldig hulpmiddel toen het werd geïntroduceerd en het is sindsdien op veel verschillende manieren geweldig geweest, maar het is een algemeen hulpmiddel, het is niet echt geschikt voor het doel. Het is zeker niet erg goed in de BI-context en ik vind het verschrikkelijk in de analysecontext. En ik vroeg me af of je wat commentaar zou moeten geven over, laten we zeggen, voorbeelden waar, weet je, Statistica is weggespoeld, overmatig spreadsheetgebruik, of een opmerking die je daarover zou willen maken?

David Sweenor: Ja, ik denk dat je bekende spreadsheetfouten kunt opzoeken. Google of welke zoekmachine u ook gebruikt, komt terug met een litanie van resultaten. Ik denk niet dat we ooit spreadsheets zullen vervangen. Dat is niet onze bedoeling, maar veel organisaties waar ik heen ga, er zijn een paar van deze spreadsheetwizards of ninja's of hoe je ze ook wilt noemen, maar ze hebben deze zeer geavanceerde spreadsheets en je moet nadenken, wat er gebeurt wanneer deze mensen winnen de lotto en komen ze niet terug? En wat we proberen te doen, is dat we weten dat spreadsheets zullen bestaan, zodat we die kunnen inslikken, maar ik denk dat we proberen een visuele weergave van uw workflow te ontwikkelen zodat deze kan worden begrepen en gedeeld met andere mensen . Spreadsheets zijn behoorlijk moeilijk, behoorlijk moeilijk te delen. En zodra u uw spreadsheet aan mij doorgeeft, heb ik deze gewijzigd en nu zijn we niet meer gesynchroniseerd en krijgen we verschillende antwoorden. We proberen hier wat vangrails omheen te zetten en dingen een beetje efficiënter te maken. En spreadsheets zijn echt verschrikkelijk in het combineren van meerdere datasets, weet je? Ze vallen daar neer. Maar we gaan ze niet vervangen, we nemen ze in en we hebben mensen die beginnen te verschuiven, want als we een knoop hebben die zegt: "risico berekenen", is dat wat de persoon die de spreadsheet gebruikt, probeert te doen. Dus die zijn weg.

Robin Bloor: Ja, ik bedoel, ik zou zeggen dat, vanuit een van de perspectieven die ik op dingen bekijk, ik zou zeggen dat spreadsheets geweldig zijn voor het creëren van informatie. Ze zijn zelfs geweldig voor het creëren van kenniseilanden, maar ze zijn echt slecht voor het delen van kennis. Ze hebben geen enkel mechanisme om dat te doen, en als je iemand een spreadsheet doorgeeft, is het niet zo dat je het kunt lezen alsof het een artikel is dat precies uitlegt wat hij doet. Het is er gewoon niet. Ik denk dat je het meest indruk op mij maakte over de presentatie en over de mogelijkheden van Statistica, het lijkt ongelooflijk agnostisch te zijn. Maar er is een rode draad doorheen deze workflow. Heb ik gelijk als ik aanneem dat je naar een end-to-end workflow zou kunnen kijken, van data-acquisitie tot het inbedden van resultaten in bepaalde BI-applicaties of zelfs actieve applicaties?

David Sweenor: Ja, absoluut. En het heeft die end-to-end-mogelijkheid en sommige organisaties gebruiken die volledig, en ik ben niet in de illusie dat een bedrijf tegenwoordig alles van één leverancier koopt. We hebben een mix. Sommige mensen gebruiken Statistica voor alles en sommige mensen gebruiken het voor de modelleringswerkstromen, sommige mensen gebruiken het voor de gegevensvoorbereidingswerkstromen. Sommige mensen gebruiken het om honderden technische rapporten onder ingenieurs te verspreiden. En dus hebben we alles daartussenin. En het is echt end-to-end en het is, weet je, een agnostisch platform, in zoverre dat er algoritmen zijn die je wilt gebruiken in R of Python, Azure, Apervita, wat je ook weet, gebruik die. Dat is geweldig, wees productief, gebruik wat je weet, gebruik waar je vertrouwd mee bent en we hebben mechanismen om ervoor te zorgen dat deze gecontroleerd en controleerbaar zijn en al dat soort dingen.

Robin Bloor: Dat aspect vind ik vooral leuk. Ik bedoel, ik weet niet of je verder kunt praten dan wat je hebt gezegd tegen de rijkdom van wat er is. Ik bedoel, ik heb dit bekeken, maar ik heb het niet uitgebreid bekeken en er is zeker een enorme hoeveelheid Python-bibliotheken in onze bibliotheken, maar is er iets dat je aan die foto kunt toevoegen? Omdat ik denk dat dat heel interessant is, weet je, het idee dat je componenten zou hebben die betrouwbaar waren, omdat je verschillende mensen kende die ze hadden gemaakt en verschillende mensen die ze gebruikten die je kon downloaden. Weet je, kun je verrijken wat je daar al over hebt gezegd?

David Sweenor: Ja, ik denk dat sommige van de app-marktplaatsen, weet je, de algoritmemarktplaatsen die er zijn. Bijvoorbeeld, weet je, Dr. John Cromwell aan de Universiteit van Iowa, hij heeft een model ontwikkeld dat voorspelt, dat in realtime wordt gebruikt terwijl we worden geopereerd, je een score zal geven als je een chirurgische site-infectie. En als die score hoog genoeg is, nemen ze een interventie in de operatiekamer. Dat is erg interessant. Dus misschien is er een ander ziekenhuis dat niet zo groot is. Nou, Apervita is een gezondheidsapp-marktplaats voor analyse. Je kunt er op veel van deze app-marktplaatsen een gaan zoeken, je kunt er een gaan zoeken en ze opnieuw gebruiken, en de transactie is tussen jou en degene die de eigenaar is, maar je kunt er een gaan zoeken of je kunt zeggen: "Hier is wat ik nodig heb. ”Ik denk dat het die wereldwijde gemeenschap benut omdat iedereen tegenwoordig een specialist is en je niet alles kunt weten. Ik denk dat R en Python één ding zijn, maar dit idee van: "Ik wil deze functie doen, een specificatie op een van deze app-marktplaatsen plaatsen en iemand het voor je laten ontwikkelen." En zij kunnen daar geld mee verdienen, denk ik dat is heel interessant en heel anders dan puur het open source model.

Robin Bloor: Oké. Hoe dan ook, ik geef de bal door aan Dez. Wil je erin duiken, Dez?

Dez Blanchfield: Absoluut en ik wil graag even op het spreadsheet-ding blijven omdat ik denk dat het de juiste inhoud heeft van veel waar we het hier over hebben. En je hebt een opmerking gemaakt, Robin, met betrekking tot de overgang van het soort oude spreadsheets in hun fysieke vorm naar elektronische vorm. We hebben iets interessants laten plaatsvinden waar, weet je, toen spreadsheets oorspronkelijk iets waren, gewoon vellen papier met rijen en kolommen waren en je handmatig dingen opschreef, dan zou je ze doornemen en berekenen, hetzij door het uit je hoofd of met een ander apparaat. Maar we hebben nog steeds de mogelijkheid om fouten te laten opgaan in handschriftfouten of dyslexie, en nu hebben we het vervangen door typefouten. Het risico is dat met spreadsheets het risicoprofiel sneller en groter is, maar ik denk dat de tools zoals Statistica de risicopiramide omkeren.

Ik teken deze foto vaak op een whiteboard van een stokfiguur van een mens bovenaan, als één persoon, en dan een verzameling van hen onderaan, laten we zeggen, stel me tien van hen voor onderaan dat whiteboard, en ik teken een piramide waar het punt van de piramide bij de enkele persoon is en de voet van de piramide de verzameling mensen. En ik gebruik dit om het idee te visualiseren dat als een persoon bovenaan een spreadsheet een fout maakt en deze met tien mensen deelt, en nu hebben we tien exemplaren van de fout. Wees heel voorzichtig met je macro's en wees heel voorzichtig met Visual Basic als je daarnaar toe gaat. Omdat wanneer we elektronische hulpmiddelen zoals spreadsheets bouwen, het erg krachtig is, maar het is ook krachtig op een goede en een slechte manier.

Ik denk dat tools zoals Statistica de mogelijkheid bieden om dat risicoprofiel om te keren en dat is dat je nu op het punt komt dat je veel tools hebt die beschikbaar zijn voor de individuele persoon en zoals ze gaan van veel tools bovenaan de piramide en dan helemaal naar beneden, waar het punt van de piramide die nu wordt omgekeerd, het eigenlijke hulpmiddel is, als we een team hebben met mensen die die hulpmiddelen en die algoritmen bouwen. En de datawetenschapper hoeft geen specialist te zijn in regressionele analyse van hun data. Ze kunnen de tool misschien gebruiken, maar je hebt misschien vijf of zes statistici en een actuaris en een datawetenschapper en enkele wiskundigen die aan die tool, die module, dat algoritme, die plug-in werken, enzovoort, in de spreadsheet, dus stel je voor dat elke gepubliceerde spreadsheet die je kunt gebruiken, eigenlijk is geschreven door specialisten die de macro's hebben getest, Visual Basic hebben getest, ervoor hebben gezorgd dat de algoritmen werkten, dus toen je het kreeg, kon je er gewoon gegevens in stoppen, maar je kon het niet echt breken en daarom was het beter om te controleren.

Ik denk dat veel van de analysetools dat doen. Ik denk dat het zover is, zie je dat nu in het veld, zie je de overgang van spreadsheets die mogelijk fouten en vergissingen en risico's kunnen duwen, tot het punt waarop de tools die je met je bouwt platforms nu, waarbij de gegevensontdekking in realtime nauwkeurig is en de mensen die de modules en algoritmen bouwen, dat risicoprofiel verwijderen of verminderen? Zien de klantenservice dat echt? Of denk je dat dit gewoon gebeurt en dat ze het zich niet realiseren?

David Sweenor: Weet je, ik denk dat er een paar manieren zijn om dit te beantwoorden. Maar wat we zien, is, weet je, in elke organisatie, en ik zei dat analyses volgens mij achterblijven bij het perspectief van bedrijfsinvesteringen, een soort van wat we deden met datawarehousing en CRM. Maar wat we zien, dus er is veel nodig om een ​​organisatie te veranderen, om die organisatorische inertie te overwinnen. Maar wat we zien, is dat mensen hun spreadsheets gebruiken, hun workflows nemen, en ik noemde de beveiliging en het beheer: "Nou, misschien heb ik een spreadsheet, " "Nou, ik kan dit vergrendelen en ik kan het versiebeheer." En we zien veel organisaties, misschien beginnen ze daar gewoon. En als het is veranderd, is er een workflow en ik eindig, nummer één, wie heeft het veranderd? Waarom ze het veranderden. Toen ze het veranderden. En ik kan ook een workflow instellen zodat ik deze nieuwe spreadsheet niet in productie ga nemen, tenzij deze wordt gevalideerd en geverifieerd door één, twee, drie, hoeveel partijen u ook in uw workflow wilt definiëren. Ik denk dat mensen beginnen te nemen, en organisaties beginnen daar babystappen te zetten, maar ik zou waarschijnlijk suggereren dat we nog een lange weg te gaan hebben.

Dez Blanchfield: Inderdaad en ik denk dat gezien het feit dat je zowel de beveiligingscontroles als de governance daarin inbouwt, de werklast dit automatisch in kaart kan brengen en alles tot aan de chief risk officer, wat nu een ding is. Je kunt beginnen te bepalen hoe die tools en systemen worden benaderd en wie wat ermee doet, dus dat is zeer krachtig. Ik denk dat de andere dingen die hierin komen, zijn dat het soort hulpmiddelen dat je voor mij biedt, meer leent voor menselijk gedrag dan voor de traditionele spreadsheets waar we het over hebben, dat als ik een kamer vol mensen heb met hetzelfde dashboard en toegang tot dezelfde gegevens dat ze daadwerkelijk een andere weergave kunnen krijgen en, als gevolg daarvan, enigszins andere inzichten krijgen van dezelfde informatie, die past bij hun behoeften, zodat ze kunnen samenwerken. We hebben dan een meer menselijke kijk op en interactie met het bedrijf en het besluitvormingsproces, in tegenstelling tot iedereen die naar dezelfde vergadering gaat met dezelfde PowerPoint en dezelfde spreadsheets die worden afgedrukt, allemaal dezelfde vaste gegevens.

Zie je een transitie in gedrag en cultuur in organisaties die nu je tools gebruiken waar ze dat zien gebeuren, waar het niet is alsof vijf mensen in de kamer naar dezelfde spreadsheet kijken die het proberen te verwoorden en er aantekeningen over maken, maar nu werken ze eigenlijk in realtime met de dashboards en de tools, met visualisatie en analyse binnen handbereik en krijgen ze een compleet andere stroom over het gesprek en de interactie, niet alleen in vergaderingen, maar gewoon algemene samenwerking rondom de organisatie? Omdat ze het realtime kunnen doen, omdat ze de vragen kunnen stellen en een echt antwoord krijgen. Is dat een trend die je momenteel ziet of is dat nog niet helemaal gebeurd?

David Sweenor: Nee, ik denk dat het zeker op die weg is begonnen en ik denk dat het heel interessant is, weet je, als we bijvoorbeeld het voorbeeld van een fabriek nemen. Misschien iemand die een bepaalde processector in die fabriek bezit, die ze op een bepaalde manier willen bekijken en met deze gegevens willen omgaan. En misschien ik, met uitzicht op alle processen, misschien deze onderaan, misschien wil ik er overal naar kijken. Ik denk dat wat we zien, nummer één is, dat mensen een gemeenschappelijke set visualisaties of standaardvisualisaties binnen hun organisaties beginnen te gebruiken, maar het is ook afgestemd op de rol die ze spelen. Als ik een procesingenieur ben, misschien dat is een heel ander beeld dan iemand die ernaar kijkt vanuit een supply chain-perspectief, en ik vind dat geweldig omdat het moet worden aangepast en moet worden bekeken door de lens die je nodig hebt om je werk gedaan te krijgen.

Dez Blanchfield: Ik denk dat het besluitvormingsproces tijdrovend en snel verloopt, om ook daadwerkelijk slimme en nauwkeurige beslissingen te nemen, toch snel? Want als je realtime analyses, realtime dashboards hebt, als je de Statistica-tools binnen handbereik hebt, hoef je niet over de vloer te rennen om iemand over iets te vragen, je hebt het op papier. Je kunt een soort van samenwerking, interactie en daadwerkelijk beslissingen nemen en direct dat resultaat krijgen. Ik denk dat sommige bedrijven dit nog niet echt hebben begrepen, maar als ze dat doen, wordt het dit eureka-moment dat, ja, we nog steeds in onze cellen kunnen blijven en thuis kunnen werken, maar we kunnen communiceren en samenwerken en die beslissingen we maken terwijl we samenwerken direct in resultaten veranderen. Kijk, ik vind het fantastisch om te horen wat je tot nu toe te zeggen hebt en ik kijk er echt naar uit om te zien waar het heen gaat. En ik weet dat we veel vragen hebben in de Q&A, dus ik ga terug naar Rebecca om er een paar door te nemen, zodat we daar zo snel mogelijk naar toe kunnen gaan. Hartelijk dank.

Rebecca Jozwiak: Bedankt Dez en ja Dave, we hebben nogal wat vragen van het publiek. En bedankt Dez en Robin ook voor je inzichten. Ik weet dat deze specifieke deelnemer precies op het uur moest afhaken, maar ze vraagt ​​een beetje, zie je dat de afdelingen van informatiesystemen meer prioriteit geven aan geavanceerde gegevenscontroles dan dat ze zich comfortabel voelen in het bieden van hulpmiddelen om de kenniswerkers? Ik bedoel, is dat - ga je gang.

David Sweenor: Ja, ik denk dat het van de organisatie afhangt. Ik denk dat een bank, een verzekeringsmaatschappij, misschien andere prioriteiten en manieren hebben om dingen te doen, versus een marketingorganisatie. Ik denk dat ik zou moeten zeggen dat het alleen maar afhangt van de branche en de functie waarnaar je kijkt. Verschillende industrieën hebben verschillende focus en nadruk.

Rebecca Jozwiak: Oké, dat is logisch. En toen wilde een andere deelnemer weten, wat is de motor achter Statistica? Is het C ++ of je eigen spullen?

David Sweenor: Nou, ik weet niet of ik er zo specifiek aan kan komen dat dit al 30 jaar bestaat en het vóór mijn tijd is ontwikkeld, maar er is een kernbibliotheek met analytische algoritmen die Statistica-algoritmen zijn die worden uitgevoerd. En je zag hier dat we ook R kunnen draaien, we kunnen Python draaien, we kunnen naar Azure barsten, we kunnen Spark op H2O draaien, dus ik denk dat ik die vraag moet beantwoorden in termen van, het is een verscheidenheid aan motoren. En afhankelijk van welk algoritme je kiest, als het een Statistica is, werkt het zo, als je er een kiest op H2O en Spark, gebruikt het dat, en dus is het een verscheidenheid aan.

Rebecca Jozwiak: Oke goed. Een andere deelnemer vroeg een soort specifiek naar deze dia te wijzen, en wilde eigenlijk wel weten hoe de burgerwetenschapper weet welke herbruikbare sjablonen hij moet gebruiken? En ik denk dat ik daar een bredere vraag van zal maken. Dat, wat zie je wanneer zakelijke gebruikers of bedrijfsanalisten binnenkomen en deze tools willen gebruiken, hoe gemakkelijk is het voor hen om op te pakken en te gaan werken?

David Sweenor: Ik denk dat ik dat zou beantwoorden en als je kunt gebruiken, als je bekend bent met Windows, dit een Windows-gebaseerd platform is, dus heb ik de bovenkant van deze screenshots afgesneden, maar het heeft het Windows-lint. Maar hoe weten ze welke workflow ze moeten gebruiken? Het lijkt op de Windows Verkenner, dus er is een boomstructuur en u kunt deze configureren en instellen zoals uw organisatie deze wil instellen. Maar het zou kunnen, je zou gewoon deze mappen hebben en je zou deze herbruikbare sjablonen in deze mappen plaatsen. En ik denk dat er waarschijnlijk een nomenclatuur is die uw bedrijf zou kunnen gebruiken, zeg hier het "bereken risicoprofiel", hier is het "gegevens ophalen uit deze bronnen" en u noemt ze wat u maar wilt. Het is gewoon een gratis map, je sleept de notities gewoon naar je canvas. Dus vrij eenvoudig.

Rebecca Jozwiak: Oke goed. Misschien een demo de volgende keer. Dan komt er een andere deelnemer naar voren, en dat is waar jij en Robin en Dez het over hadden, tot de onnauwkeurigheden, vooral op een spreadsheet, maar het afval erin / afval eruit, en hij ziet het als nog kritischer wanneer het komt naar analyses. Een beetje vermelden dat, weet je, misbruik van gegevens echt tot een aantal ongelukkige beslissingen kan leiden. En hij vraagt ​​zich af wat jouw mening is over de ontwikkeling van meer faalveilige algoritmen, denk ik dat hij het woord 'overijverig' gebruik van analyses gebruikt. Weet je, iemand komt binnen, ze worden echt enthousiast, ze willen deze geavanceerde analyses doen, ze willen deze geavanceerde algoritmen uitvoeren, maar misschien zijn ze niet helemaal zeker. Dus wat doe je om je daar tegen te beschermen?

David Sweenor: Yeah, so I guess I'll answer this as best I can, but I think everything comes down to people, process and technology. We have technology that helps enable people and helps enable whatever process you want to put in within your organization. In the example of sending a coupon to somebody, maybe that's not as critical, and if it's digital it's really no cost, maybe there's one level of security controls and maybe we don't care. If I am predicting surgical site infections, maybe I want to be a little more careful about that. Or if I am predicting drug quality and safety and things like that, maybe I want to be a little more careful about that. You're right, garbage in/garbage out, so what we try to do is provide a platform that allows you to tailor it to whatever process your organization wants to adopt.

Rebecca Jozwiak: Okay good. I do have a few more questions, but I know we've gone quite a bit past the hour and I just want to tell our presenters, that was awesome. And we want to thank so much Dave Sweenor from Dell Statistica. Of course, Dr. Robin Bloor and Dez Blanchfield, thank you for being the analysts today. We are going to have another webcast next month with Dell Statistica. I know Dave kind of hinted about the topic. It will be about analytics at the edge, another fascinating topic, and I know that some very compelling use cases are going to be discussed on that webcast. If you liked what you saw today, come back for more next month. And with that, folks, I bid you farewell. Heel erg bedankt. Tot ziens.

Sluit analyses overal in: de burgerwetenschapper in staat stellen