Huis In het nieuws Differentiatie wordt zichtbaar: een nieuw tijdperk van schaalbare infrastructuur komt eraan

Differentiatie wordt zichtbaar: een nieuw tijdperk van schaalbare infrastructuur komt eraan

Anonim

Door Techopedia Staff, 11 mei 2016

Takeaway: Host Rebecca Jozwiak bespreekt de vooruitgang in database-architectuur en opslag met Dez Blanchfield, Robin Bloor en Brian Bulkowski.

Je bent momenteel niet ingelogd. Log in of meld je aan om de video te bekijken.

Rebecca Jozwiak: Dames en heren, hallo en welkom bij Hot Technologies van 2016. Vandaag zijn we: "Blootstelling aan differentiatie: een nieuw tijdperk van schaalbare infrastructuur komt eraan." Ik sta vandaag in voor Eric Kavanagh. Ik ben Rebecca Jozwiak, je bescheiden gastheer van de bestuursgroep terwijl Eric op Jamaica is. Goed voor hem.

Dus, zoals het al tientallen jaren is, is dit jaar hot, hoewel de technologie aantoonbaar in een tempo beweegt dat de wet van Moore overtreft, en wat doen organisaties om bij te houden? Ze zijn op zoek naar wat snel is, en schaal, zou ik betogen, is waarschijnlijk een van de belangrijkste dingen als we aan databases denken. En natuurlijk hebben we de opties voor de gebruikelijke relationele, nu hebben we onze NoSQL, we hebben onze column store, we hebben onze grafische databases, onze RDF-databases, maar echt, waar bedrijven naar op zoek zijn, is schaal, is parallellisme en is snel .

Nu waren traditionele architecturen min of meer gebaseerd op dat relationele model. Maar als je kijkt naar de meeste webbusiness die de afgelopen drie, vijf, tien jaar is ontstaan, zijn dat niet de modellen die ze voor hun infrastructuur gebruiken. Ze gebruiken een andere, een parallelle architectuur, ze zijn schaalbaar en ze zijn snel, en dat is waar veel mensen tegenwoordig naar toe gaan.

Onze line-up, we hebben Dez Blanchfield, hij is een wetenschapper van de Bloor Group. We hebben dokter Robin Bloor, onze hoofdanalist bij de Bloor Group, en we hebben Brian Bulkowski, CTO en oprichter bij Aerospike. Dus jongens daarmee, ik ga het overdragen aan Dez.

Dez Blanchfield: Bedankt en bedankt dat je me hier hebt. Ik ga proberen de toon te zetten voor hoe we min of meer snel zijn aangekomen waar we zijn, en we zullen in veel meer technische details duiken als we door de onderwerpen van vandaag gaan. Ik ga hier gewoon de controle over het scherm krijgen.

Dus groter, beter en sneller. Als ik denk aan waar we ons bevinden, is het beeld dat me persoonlijk te binnen schiet, precies dat beeld dat ik op mijn titeldia heb staan, wat de uitbreiding van het universum is. We hebben de technologie nu al tientallen jaren laten ontwikkelen en groeien, in feite vanaf het eind van de jaren vijftig toen het mainframe echt werd. Technologie is in veel gevallen blijven groeien op een slechter of groter dan een lineaire curve, afhankelijk van welk deel van de curve je gebruikt, voor zover de software of hardware gaat.

De schaal is groter en groter geworden, en sneller en sneller, voor zover we proberen te leveren, en kleiner en kleiner op het niveau van productie en halfgeleider. En in het midden is er software en de applicaties en de systemen die die software ondersteunen, en ze worden steeds kleiner van aard, en we hebben dingen gezien als container-applicaties en microservers, het is weer iets geworden. We deden dat in het verleden, decennia eerder, maar als gevolg van het kleiner en kleiner worden, worden we groter en groter op de schaal waarvan we nu dingen kunnen uitvoeren, zoals applicaties en bepaalde databases, en de logica van die databases.

Ik heb deze weergave waarin we heel horizontaal zijn geschaald, in wezen op de X-as; we zijn verticaal geschaald in de Y-as. We zijn nu op het punt waar we ergens anders naartoe moeten gaan, en in mijn gedachten is dat soort mentaal gezien als een Z-as, en dat is dat we diep in de technologie moeten gaan en kijken hoe we het kunnen doen dingen anders dan wat we tot nu toe hebben gedaan, om dat extra stukje snelheid te krijgen. Dus visualiseer ik deze hele uitbreiding van het universum, waar een explosie heeft plaatsgevonden, en sommige technologieën bestaan, en deze betere lineaire groei en vraag. We hebben verschillende manieren moeten vinden om dat grotere, betere, snellere resultaat te krijgen.

Gewoon om snel een soort van waar we nu zijn te dekken in een paar hardware-omgevingen. We hebben gezien dat de dalende kosten van een gigabyte schijfruimte een paar vrij grote overgangen en technologie met zich meebrengen, en benaderingen van het grotere, betere en snellere schaalprobleem. Dit zijn twee afzonderlijke grafieken die ongeveer een decennium per stuk beslaan, elk iets meer dan een decennium van de dalende prijs van één gigabyte ruimte op de harde schijf.

Het is een klassieke J-curve of een hockeystick zoals we ze vaak noemen, omdat je enige tijd geleden letterlijk honderdduizenden dollars kon uitgeven om een ​​gigabyte schijfruimte te kopen, nog geen twee decennia geleden, terwijl het tegenwoordig dollars en uiteindelijk weet ik zeker dat het zal eindigen, wat we de race naar nul noemen, wordt het cent. Dat bracht een interessante verandering teweeg in het soort dingen dat bedrijven konden doen. En ik noem dat een verstoring door gegevens of met name big data, en daarmee bedoel ik dat we technologieën zagen, zoals hoe we iets kunnen worden waar we heel horizontaal in opslag kunnen schalen, en het type computer dat we kan van toepassing zijn op die opslag, en hoe het een interessante technologie opent, omdat het ons in staat stelt om zeer grote, redundante parallelle opslag op het snelste niveau te doen, en Hadoop-onderdelen op zichzelf, native in staat zijn om gegevens te kopiëren in een schrijf eenmaal gelezen vele malen formaat, en schaal het ding gewoon uit op een bijna lineaire graad.

En het zijn alle bedrijven zoals deze die zich houden aan verstoring met behulp van big data. We hebben bedrijven zoals Uber die 's werelds grootste taxibedrijf zijn. Ze bezitten eigenlijk geen taxi's, en het is een lange lijst hier. Airbnb is de grootste aanbieder van accommodaties, heeft eigenlijk geen onroerend goed. Een van mijn favorieten is Facebook, bijvoorbeeld in deze lijst, waar ze niet echt de inhoud maken, wij maken het voor hen, maar ze zijn eigenlijk de grootste media-eigenaar ter wereld. We hebben interessante, zoals de snelst groeiende banken, die eigenlijk geen geld hebben. Dit zijn peer-to-peer leenplatforms en banken, en er is er één in Australië die steeds meer bekendheid krijgt, genaamd SocietyOne. En sommige grote banken die wel contant geld moeten hebben, investeren in die specifieke peer-to-peer bank. En we gaan door deze lijst, zelfs tot Netflix; ze hebben eigenlijk geen bioscopen en toch zijn ze in feite het grootste bioscoophuis ter wereld.

Dus kwamen ze waar ze waren, in mijn gedachten, door de toepassing van slimme technologieën op dataniveau, omdat we grotere en bredere opslag konden doen tegen lagere kosten vanwege de gedaalde prijs van een gigabyte harde schijfruimte, en we konden pas wat intelligent rekenwerk toe en verspreid daar een computermodel over. Deze bedrijven hadden de mogelijkheid om een ​​concurrentievoordeel te creëren en te verstoren als gevolg van die dalende kosten van schijfruimte.

We hebben iets soortgelijks zien gebeuren in de kosten van geheugen. Een paar decennia geleden, als je zes miljoen dollar rondslingerde, zou je een gigabyte RAM kunnen kopen, en we hadden een zeer vergelijkbare J-curve of hockeystick, die plaatsvonden in de verlaging van de kosten of de gedaalde prijs van RAM. En dat heeft een aantal interessante dingen teweeggebracht, en naar mijn mening is een van de grootste verstoringen in die ruimte de hoeveelheid geheugen die kan worden ingebouwd in apparaten, zoals mobiele apparaten, zoals telefoons en tablets, en zelfs laptops. Tegenwoordig is de hoeveelheid geheugen die een gemiddelde laptop in beslag neemt in sommige gevallen behoorlijk belachelijk. In sommige gevallen heeft mijn huidige laptop meer geheugen dan sommige van de servers die ze nog niet zo lang geleden gebruikten.

Dit heeft op zichzelf een aanzienlijke verandering teweeggebracht, op een vergelijkbare manier als een RAM in mijn gedachten heeft, het stelde ons in staat om snel te schalen en te schalen. En nu hebben we de opkomst van een technologie die we flash noemen, en dit is een technologie die oorspronkelijk voortkomt uit iets dat op hardware staat in de vorm van een EEPROM, een kleine chip die is ontworpen om beschikbaar te zijn, en schrijven naar, en dan, net toen de stroom uitviel, zou alles wat u naar die chip schreef als blijvende opslag behouden. Het was traag, het was onhandig en in die dagen, denk ik dat het ongeveer 1980-1981 was, werd het een ding. Tegen 1984 maakte Toshiba, die volgens mij de technologie heeft uitgevonden, er een commercieel iets van dat we konden gebruiken.

Maar het duurde niet lang voordat mensen erachter kwamen dat ze daadwerkelijk een combinatie van de componenten konden gebruiken die werden gebruikt om dit concept van een EEPROM, een alleen-lezen geheugen, te maken, nadat het eenmaal was gewist en er naar was geschreven, en ze konden er eigenlijk naar schrijven op een regelmatige basis, en gebruik het een beetje meer als schijfruimte, en een beetje meer als RAM. Na verloop van tijd ontwikkelde het zich. Nu is deze flash-opslagtechnologie een samensmelting geweest tussen traditionele schijfopslag, of het nu een draaiende schijf is of in sommige gevallen een hybride schijf met geheugen en RAM. En het belangrijkste is het systeem ertussen, omdat u het kunt lezen en ernaar kunt schrijven en vervolgens de stroom kunt uitschakelen en het zal behouden wat u erop hebt geschreven. Dus een schijfruimte, u schrijft er duidelijk naar, u schakelt de stroom uit, en de draaiende as en de sterk gewijzigde, voor een betere beschrijving, houden de nullen en enen die u erop hebt geschreven.

In de willekeurig toegankelijke geheugenruimte schrijft u iets naar het geheugen in RAM, schakelt u de computer uit en wordt alles gewist omdat er geen elektronen meer zijn om deze opgeladen te houden en de informatie vast te houden die u erop hebt geschreven. Bovendien zit hij in het midden en is hij extreem snel, sneller dan schijf, iets langzamer dan RAM. Maar u kunt ernaar schrijven en ervan lezen, en wanneer u de stroom uitzet, zal het blijven bestaan. Dit heeft een aantal verbazingwekkende technologieën opgeleverd en met name hebben we mobiele apparaten en laptops ontwikkeld die echt, heel snel en veel dingen kunnen doen, en nu is het verplaatst naar de infrastructuurruimte rond opslag en berekenen, en dat heeft aanzienlijke gevolgen gehad veranderingen in wat we op schaal kunnen leveren. Dit is een soort van waar ik geloof dat de Z-as in mijn gedachten nu tot stand komt.

Het is bijna net op tijd op veel manieren, omdat we nu een verstoring hebben gezien door wat ik de vraag noem, en dat is dat consumenten hebben, ongeacht wat er gebeurt in de infrastructuur en de technologische ruimte, en de mogelijkheid om sneller te rijden en sneller berekenen en prestaties op infrastructuurniveau, eisen consumenten deze verstoring in de vorm van wat nu wordt aangeduid, de ervaring van beroemdheden. Iedereen wil dat elk systeem, elke app, elke website weet wie ze zijn en wat ze leuk vinden en hen een persoonlijke een-op-een-ervaring kunnen bieden. Het is niet meer goed genoeg om naar een website te gaan waar ik bioscoopkaartjes koop. Ik wil dat het weet wat ik eerder heb gekocht, waarom ik het heb gekocht en mogelijk wat mensen zoals ik hebben gekocht en dingen aanbevelen.

Onveranderlijk zien we dat ik verwijs naar een bijgerecht van sociaal, en dat is dat ik de beroemdheidservaring wil, maar ik wil ook dat idee socialiseren, ik wil het delen met al mijn vrienden en hen vertellen wat ik ben aan het doen, en ik wil ook weten wat mijn vrienden aan het doen zijn. En dit is het gevolg van een explosieve vraag naar extra computers en opslag en een snelle doorlooptijd. We hebben de Fitbit-generatie gezien, wat ik altijd 'on-tracking' noem. Alles wat ik doe wordt gevolgd en vastgelegd en ergens vastgelegd. We hebben alles in realtime gezien: bankieren, bieden, aanbevelingsprogramma's, het moeten kunnen omgaan met realtime dingen die ik persoonlijk als consument doe.

En dan zien we een zeer grote impact, zoals de beveiligingsrisico's rond cyberbeveiliging. Vroeger hadden we individuele hackers, toen moesten criminele bendes zich hierop toeleggen, nu hebben hele landen oorlog via internet, wat echt is en echt gebeurt. Besteed daar aandacht aan, ga rechtop zitten en kijk ernaar, want dat heeft een grote impact, en sommige van onze pre-show scherts bespraken het risico dat je eigen computer, of tenminste je netwerk, zou doordringen.

We hebben dit concept van entiteitsextractie gezien. Entiteitsextractie is wanneer we interessante dingen moeten vinden in zeer grote gegevenssets en met name rond fraude en illegale activiteiten van het type hacker. Maar vaker wel dan niet, zullen we zien dat entiteitsextractie een aandachtspunt wordt voor goede dingen, en dingen die van waarde zijn voor ons, in tegenstelling tot het zoeken naar dingen die ons aanvallen.

We hebben ook een explosie gezien, wat geospatiale gegevens wordt genoemd. Dit zijn gegevens die daadwerkelijk weten waar het vandaan komt of waar andere gegevens zoals het vandaan komen. Je kunt je voorstellen dat je op straat staat en je wilt het dichtstbijzijnde parkeerstation of het dichtstbijzijnde restaurant vinden, toepassingen die geospatiale berekeningen en gegevens kunnen toepassen, gegevensverwerking, die weet waar het zich in de ruimte bevindt, is erg belangrijk omdat je moet kunnen weten waar andere objecten en entiteiten zijn, en dat snel doen.

We hebben permanent verbonden mobiel gezien. Zelfs als we 's nachts gaan slapen, tikken onze mobiele telefoons nog steeds weg, werken we onze e-mails bij, controleren we onze kalenders, bekijken we wat voor weer het is en komen we erachter of wat we willen als ontbijt beschikbaar zal zijn. Er gebeurt daar veel lawaai, en dat heeft een enorme impact gehad op wat we aan de achterkant moeten doen, en hoe snel we het doen.

Over het geheel genomen de enorme omvang en impact van wat wordt aangeduid als het internet der dingen, of vaker wel dan niet, de machine-to-machine-connectiviteit, waar apparaten met apparaten praten en dat gaat helemaal tot aan motoren die vastzitten aan de kant van vliegtuigen die het vliegtuig zelf, of het vliegtuigbeheersysteem, vertellen dat een invloed op motor nummer vier overmatige slijtage en hitte ondervindt en moet worden vervangen wanneer we landen, en dan communiceert het met een andere machine, en dus moet het een bestelling, en op magische wijze verschijnt een ingenieur tijdens de vlucht op de luchthaven en is bereid deze tijdens het tanken te vervangen.

En de schaal die zo groot en zo groot is dat we moeten ingaan op wat ik ernaar verwijs, via toegang om er een beetje mee om te gaan. Omdat een nieuwe wereld en welkom in de nieuwe wereld, een nieuwe wereld waarin alles wat we gebruiken verbonden is; ooit waren het satellieten en netwerkapparaten, nu zijn het mobiele apparaten en onze laptops en tablets en telefoons, en zelfs mijn gloednieuwe Audi heeft een bord ingebouwd, en het rapporteert voortdurend over zijn eigen gezondheid, maar actualiseert zichzelf ook, en weet waar het is, en welke kaarten van toepassing zijn, en vertelt me ​​zelfs wanneer ik een andere route moet gaan als er verkeer op de weg is.

Alles wat we nu bouwen, alles wat we nu tegen je praten, wordt ontworpen om verbinding te maken en verbinding te maken met andere dingen, niet alleen van mij naar systeem, maar van systeem naar systeem, en om daarmee om te kunnen gaan moeten heel anders denken bij de infrastructuurlaag, zowel bij de hardware als bij de software, en met name de databaselagen die systemen nodig hebben om dit te ondersteunen, en in veel opzichten is de database de motor geworden, en de apps zijn echt alleen kleine bots die dingen doen.

Ik ga hier snel afronden met dit enigszins humoristische beeld van waar we naartoe gaan met deze dingen, en wat ik 'IoT met een druk op de knop' noem. Er is een nieuw gadget gemaakt met de naam Amazon Dash-knop, en dit is een kleine gadget ter grootte van een duim. In feite is het op veel manieren hetzelfde als mijn USB-stick. Wanneer je dit ding koopt, kost het ongeveer $ 4, 99 in de VS bij Amazon, het wordt naar je verzonden, je configureert het met je mobiele telefoon en je sluit het letterlijk aan op een van je apparaten, zoals een koelkast of een wasmachine of wat dan ook. In het voorbeeld van je wasmachine, als je uiteindelijk geen waspoeder meer hebt, kun je op die knop drukken en deze zal naar huis bellen en automatisch meer voor je bestellen, en magisch meer naar je worden verzonden via onze goede vrienden bij Amazon.

Voor mij maakt dit me bang, omdat het een explosie gaat zien van een aantal dingen die op het netwerk zijn aangesloten en proberen connectiviteit te creëren en vraag te genereren. Als je je kunt voorstellen, is een of twee van deze dingen misschien niet zo eng, maar de laatste keer dat ik keek, waren er meer dan 110 van deze dingen gebrandmerkt, dus bijna elk merk op de planeet gaat proberen zijn eigen kleine duwtje te krijgen- knop IoT, dat je naar huis gaat en op een knop drukt en er staat: "Bestel me een pizza." Je drukt op een andere knop en het bestelt morgen een vooraf gebouwde lunch voor je kinderen voor school.

Dat drijft zo'n enorme vraag naar transformatie aan de achterkant, op applicatieniveau, met name op databaseniveau, dat ik denk dat we nog maar net het topje van de ijsberg hebben gezien van het type prestatietransformatie dat we moeten zien . En daarmee ga ik het aan dokter Robin Bloor overhandigen en zijn inzichten krijgen in het soort waar we nu ook zijn.

Rebecca Jozwiak: Oké Robin, ik heb je de bal doorgegeven.

Robin Bloor: Is dat niet goed? Oké, hier gaan we, ik ben het. Ik zag Dez's presentatie voordat ik hiernaar toe ging, dus ik zou dingen zeggen die complementair zijn in plaats van enkele dingen te herhalen die Dez zei. Ik dacht dat ik het zou hebben over database-evolutie in termen van wat er feitelijk is gebeurd met de architectuur, enzovoort, van databases vanuit een historisch perspectief.

Het fundamentele probleem dat elke databaseverkoper heeft, is het handhaven van een flexibele architectuur die schaalbaar is en gelijke tred houdt met de evolutie van de hardware. Ik zal praten dacht dit, maar als je eigenlijk terugkijkt en ziet hoe de databases vroeger werden gebouwd, en de manier waarop ze nu worden gebouwd, zijn ze eigenlijk aanzienlijk anders dan wat ik het architectonisch ontwerpniveau zou noemen . Het is de moeite waard om even na te gaan waarom dat zo is, of ik denk het tenminste. De hardwarefactoren, en Dez heeft ons een bijzonder goed overzicht gegeven van de lagere lagen in termen van geheugen en schijf. Wat we nu hebben, en dit is de toekomst komt, Intel is de volgende, CP die een FPGA erop gaat hebben. Wat mensen daarmee gaan doen, ik heb geen idee. AMD voegt CPU's en GPU's samen en wat maakt dat uit? Dit zijn het soort wijzigingen dat daadwerkelijk verschil zal maken voor de database, en ik vermoed dat onder andere Aerospike, omdat Aerospike daar door prestaties wordt aangedreven, waarschijnlijk daar al naar kijkt en uitwerkt waar het denkt dat het daadwerkelijk naartoe gaat met de manier waarop het product werkt.

We hebben een systeem op een chip die nog niet is opgestegen. SSD's die we kennen, maar het punt dat we moeten maken, is dat ze in feite toenemen in snelheid, ruwweg het tarief van Moore, een factor 10 om de zes jaar. Maar Intel staat op het punt om 3D-kruispunten uit te brengen, die beweren dat ze meer dan honderd keer sneller kunnen gaan dan SSD's, eigenlijk soort druppels in de mix, dan gaat dat de snelheid veranderen waarmee producten zoals Aerospike daadwerkelijk kunnen Gaan.

Dan hebben we de parallelle hardware-architecturen, met andere woorden de manier waarop we hardware in de zin van hebben gebouwd - oorspronkelijk was het gewoon een CPU die boven het geheugen zat, die boven de schijf zat, maar het is veel ingewikkelder dan dat. Het idee van een systeem op een chip is dat je eigenlijk parallellisme van chip naar chip kunt nemen en alles met een buitengewone snelheid kunt laten verlopen, en we hebben geen idee welke van deze producten daadwerkelijk zullen domineren.

Dat is slechts een blik op de toekomst, maar op hardwareniveau worden de prestaties sneller en blijven de kosten dalen, min of meer in de lijn die Dez aan het beschrijven was. Uw CPU's worden niet noodzakelijkerwijs goedkoper, ze worden gewoon sneller en ga zo maar door.

Vanuit het zakelijke perspectief, in sommige situaties, en dit zijn marktsituaties, is de eerste de bedrijfswaarde. Als u in het bijzonder - als u er absoluut van overtuigd bent dat een bepaalde voorraad in prijs gaat dalen, krijgt de eerste persoon die de verkooporder krijgt de beste prijs. Het is echt zo simpel. Daarom is er een technologierace die doorgaat naar geautomatiseerde handel in de banken om deze situaties daadwerkelijk te proberen te winnen. Wat gebeurde er daarna? Wat gebeurt er nadat de banken daarmee hun ding hebben gedaan? Je begint plots andere gebieden te zien besmetten met dezelfde soort behoefte aan snelheid.

Wat er echt gebeurde, is dat de mensen uit de vergelijking werden verwijderd, en dat gebeurde met reclame op het internet zeer snel. Maar het punt was, het is niet de specifieke transactie, de uitvoering van methoden, dit is een heel bedrijfsproces, het is het feit dat een webpagina net is weggegooid en er een beslissing moet worden genomen die een vrij gecompliceerde beslissing kan zijn, wat betreft de advertentie die daadwerkelijk op die webpagina moet worden geplaatst, afleidend van wie de gebruiker van de browser is, wat de meest geschikte advertentie is om dat op te zetten, enzovoort enzovoort. Het is een zeer complexe zaak geworden, en ik zal het nog eens vermelden.

Maar het punt is dat de prestaties en schaalbaarheid van bedrijfsprocessen niet hetzelfde probleem zijn als de prestaties en schaalbaarheid van een query-functie, en dit is iets dat ik me goed bewust ben, vanwege een recente briefingruimte die we met Aerospike hebben gedaan zijn ook op de hoogte van. Een ander ding, wanneer u daadwerkelijk met deze snelheden werkt, zijn eigenschappen van activa van belang voor een transactie, elke verwerking van gebeurtenissen. Ze zijn echt, echt van belang. Dus heel veel van wat sommige databases aan het doen zijn, waarbij een of twee letters van activa verloren gaan, kan redelijk goed werken in de context - dit zal goed werken in de context waar we het over hebben. Het is niet echt acceptabel, om eerlijk te zijn.

Vanuit technologieperspectief kijk je eigenlijk - ik weet dat er twee soorten hefboomwerking zijn, om het soort architecturen te creëren dat eigenlijk nodig is om het soort snelheden te geven dat, zoals Aerospike, een miljoen transacties kan doen per seconde. Je moet eigenlijk heel precies zijn wat betreft de softwareontwikkeling. Je kunt niet zomaar weghacken. U moet zich zorgen maken over de lengte van het codepad. U moet uitstekend gebruik maken van het geheugen en u optimaliseert eigenlijk hele transacties. Je hebt intelligent parallellisme nodig en je hebt ook faalveilig parallellisme nodig. Je moet opschalen in plaats van opschalen, want zodra je het netwerk ergens bij betrekt, wordt het de meest waarschijnlijke aanwijzer die je latentie gaat halen en het gaat de transacties te langzaam maken.

Je moet zoveel mogelijk toegang krijgen tot een bekend netwerk voordat je daadwerkelijk opschaalt, en je wilt echt niet snel opschalen, je wilt echt niet veel processen. U wilt een netwerk dat door niemand anders wordt gebruikt. En u wilt een ongelooflijk snel netwerk hebben.

Versnelde SSD-opslag is iets - eigenlijk denk ik dat het meeste van toepassing is op wat Aerospike doet. Een van de interessante dingen is dat het een NoSQL-database is. Vroeger geloofde het - ik weet het niet, een aantal jaar geleden - geloofde het vroeger dat de relationele database de enige database was en alles domineerde, en het waren alleen deze vreemde kleine nichesituaties waar je niet nodig had om relationeel te gaan. Het is nu op zijn kop gezet. Het zijn de snelle databases die zich in die SQL-databases bevinden, en een van de redenen daarvoor, de belangrijkste reden daarvoor, is dat ze geen gegevens samenvoegen, ze gegevens vrijwel objectief opslaan. Wanneer u klaar bent met een object, slaat u het gewoon op en trekt u het hele object terug, het verbindt de dingen niet om ze daadwerkelijk te verwerken. Dit is waar snelheid om draait. Dit soort technieken die snelheid genereren binnen de databasecontext.

Dit is het spoor van tranen, dit is het, wat er met de database is gebeurd. Het verhaal of het verhaal van de relationele databases was het einde van een database was eigenlijk niet waar. Zelfs toen ze begonnen te domineren, was het nog steeds noodzakelijk. Objectdatabases deden de afgelopen transacties in die dagen, omdat relationele databases ze eigenlijk niet konden doen, en toen bleek dat de relationele databases met rijopslag ook geen snelle zoekopdrachten konden uitvoeren, je had kolomopslag nodig. En toen ontdekten we dat als je eigenlijk grafische query's op gegevens wilde doen, noch een kolomopslag noch een relationele database goed zou zijn, en je eigenlijk een specifiek voor de grafiek bewuste database voor je had moeten bouwen. Toen kwamen RDF-databases binnen, en zodra je daadwerkelijk de betekenis van semantiek begon te overwegen en we de NoSQL-databases in kregen, heel, heel specifiek voor snelheid. NoSQL noemen is bijna alsof je al deze databases brandt alsof ze hetzelfde zijn, eigenlijk zijn ze radicaal anders in wat eronder ligt. De enige reden dat ze de naam NoSQL dragen, is dat ze niets om SQL geven omdat het te duur is. De transactie-latenties die ze nodig hebben.

Het IoT - waarvan ik dacht dat ik zou eindigen op hetzelfde punt waarop Dez het afmaakte - het is nog niet voorbij, al deze situatie in termen van snelheid en de latentievereisten, het is niet voorbij totdat de dikke dame begint negeer deze gegevens, en het is nog niet echt begonnen. Veel van die gegevens zullen de latenties willen hebben die ik min of meer heb aangegeven, dus ik denk dat dat alles is wat ik te zeggen heb. Laten we het doorgeven aan Aerospike en Brian Bulkowski.

Brian Bulkowski: Hallo, heel erg bedankt voor je deelname aan de Bloor Group en mijzelf voor deze presentatie vandaag. Bij het nadenken over waar Dez en Robin het net over hadden, wil ik u graag wat vertellen over het spoor dat Aerospike heeft gevolgd bij het aanbieden van nieuwe databasetechnologie en NoSQL-databasetechnologie voor een aantal industrieën. Het was een geweldig pad. We zijn begonnen met Aerospike in 2008 en zagen veel van de trends die Dez en Robin hebben genoemd. Specifiek over in-memory databases die kunnen profiteren van flash, evenals het soort scale-out cloud-systemen, en de soorten schaal die nodig zijn om personalisatie, gedragsanalyses en het soort VIP-ervaringen die werden besproken, te bespreken.

Toen we het probleem van een database benaderden die een front-end operationele database was die in staat was om de onderbouwing te bieden voor applicaties die konden worden geschreven om deze op te lossen, begonnen we met het probleem van hoe we in wezen een gedistribueerde hashtabel, geheugen konden bouwen -gedistribueerde hashtabel die verbazingwekkend snel was en in staat was tot miljoenen transacties per seconde, maar tegen een redelijke prijs. Toen we ons prototype af hadden, realiseerden we ons dat we erachter zouden moeten komen wie dit soort snelheid nodig zou kunnen hebben. Als een bedrijf in Silicon Valley, kwamen we er al snel achter dat het echt de reclame-industrie was die in staat was om dit soort informatie te consumeren en erin geïnteresseerd was, en dus wil ik een seconde praten over realtime bieden en hoe dit markt werkt.

Robin noemde hoe financiële handel werkt, wat de eerste transactie is die vaak de winnende transactie is, en er is in wezen een time to market van latentie en een waarde van latentie. De reclame-industrie is op een interessante manier enigszins anders, omdat het doel van reclame een specifiek doel is - wat een indruk wordt genoemd, de mogelijkheid om een ​​advertentie te leveren - een veiling is en die veiling loopt tussen tien milliseconden tot vijftig milliseconden. De naam van het spel, en er zijn vaak honderden bedrijven die nu in realtime bieden op elke advertentie die op internet wordt geplaatst, is om de meeste hoeveelheid gegevens te krijgen en de beste algoritmen te leveren binnen die tien tot vijftig milliseconden over de grootste hoeveelheid gegevens.

Deze verandering en verschuiving vond plaats in de reclame-industrie, in elk van die kleine milliseconden, hebben een tijdsgebonden complicatie met de beste algoritmen over de grootste hoeveelheid gegevens, en om dat te doen breng je veel kleine stukjes gegevens. Recente IP-adresinformatie, recente informatie over een bepaalde apparaatcategorie, recente informatie over websitegedrag, recente zoektermen, alles zou ingaan op de geheime saus van de algoritmen van een bepaald bedrijf om een ​​prijs en een bod te bepalen.

Dit is een fascinerende markt geweest om deel van uit te maken. We hebben voor het eerst onze eerste implementatie bij Aerospike gedaan in 2010, waarbij enkele van de eerste bedrijven serieus werkten in de realtime biedeconomie, en hebben dan, in wezen die front-end store van gedragsgegevens bereikt, voor de meerderheid van de bedrijven in die ruimte. Wat we sindsdien hebben gevonden, en een specifieke architectuur is die ik in de loop van deze presentatie zal beschrijven, is dat dit allemaal gebeurde in 2010, 2011, 2013 en blijft evolueren. Adverteren is een zeer dynamische markt.

Maar dat soort VIP-ervaring, kun je zien als het plaatsen van de juiste advertentie, het plaatsen van geen advertentie voor bijvoorbeeld kinderproducten, omdat ik toevallig geen kinderen heb, dus ik ga geen effectieve advertentie hebben als het geplaatst, maar als het om snelle auto's gaat, is dat het soort advertentie dat Brian moet plaatsen. Dat is echt het soort VIP-ervaring in deals, of je nu korting moet krijgen of niet, als je op een retailsite bent, zelfs als je fraude detecteert. Is dit het normale patroon van een bepaalde persoon of een bepaalde creditcard? Al die vorm van technologie van real-time analyse, van gedragsvoorspelling, van voorspellende analyse, stroomt nu uit de reclame-industrie, die het nu al een paar jaar doet voor plezier en winst en echt in de detailhandel komt en bankieren, en fraudedetectie, enz., via een bepaalde architectuur. Aerospike heeft dus het voorrecht gehad deel uit te maken van een aantal van die zaken.

De architectuur die we zien werken, en praktisch is om dit te doen, is er een in plaats van het maken van een set vragen van een applicatieserver, in plaats daarvan meer van uw berekening naar de app-server zelf te verplaatsen en vervolgens een database als in wezen opslag te gebruiken motor voor het soort objecten waar Robin het over had. In dit geval verwarren deze architecturen dit in de eerste plaats niet met uw daadwerkelijke analyses hier. Aan de rechterkant van deze dia zie je dat er nog steeds analyses zijn om inzichten te genereren. Dit zijn taken die vaak via petabytes werken, tientallen petabytes aan gegevens, zelfs exabytes in het geval van sommige van onze grote klanten, met behulp van een verscheidenheid aan technologieën. Je hebt een big data-team nodig, een analyseteam, een kwantitatief team daar achter wat uitzoekt wat bijvoorbeeld geografische coördinaten ertoe doen, welke modellen werken in termen van het vinden van die relaties en het creëren van de VIP-ervaring. Dat is een heel probleem op zichzelf en geen probleem waaraan Aerospike rechtstreeks heeft deelgenomen, en er is een heleboel geweldige technologie als je met dat soort systemen te maken hebt.

Waar we enthousiast over zijn en waar we met de industrie over werken, is, als je eenmaal die inzichten hebt, hoe je deelneemt aan het soort machine-naar-machine of snelle machine-aan-mens transactie, waar je die inzichten neemt en ze echt voor elke persoon, van moment tot moment? De architectuur die we daar hebben zien gebruiken, is er een waarin een applicatieserver is geschreven en al die wiskunde doet en de modellen bekijkt die je hebt gemaakt, en kijken naar recent gedrag en dat doen in wezen een belangrijk paradigma of ten minste een zeer licht soort systeem.

Als je te maken hebt met het soort gegevenstypen waar we het over hebben, het soort stromen waar we het over hebben, met miljoenen schrijfacties per seconde, miljoenen leesbewerkingen per seconde, miljoenen en honderden en duizenden beslissingen per ten tweede, het bouwen van complexe indexen, multidimensionale indexen, werkt gewoon niet erg goed, het is niet schaalbaar. De manier om deze vorm van schaal te bereiken is door veel parallellisme aan te gaan. We zullen later wat meer vertellen over hoe we dat doen. Maar een deel daarvan is een stateless app-server geschreven in uw eigen taal.

Wat we vaak zien, is een bepaald project dat uitgaat van een nieuw toepassingskader op basis van de mensen die er werken, de technologie die ze gebruiken en het probleem dat ze naderen. We hebben mensen Python zien gebruiken, veel mensen gebruiken Java, we zien nog steeds C-programmeurs, omdat veel hiervan nog steeds hoge prestaties leveren, misschien zelfs dingen zoals de oude MATLAB-bibliotheken gebruiken. En ze moeten duizenden en duizenden datapunten per seconde aanraken om een ​​effectieve beslissing te nemen.

Een vraag die ik soms had gesteld, is: "Wel, Brian, als je in staat bent tot miljoenen transacties per seconde, wie heeft dat nodig?" Als je bijvoorbeeld kijkt naar de Noord-Amerikaanse betalingsverwerking en Aerospike is betrokken bij oplossingen die fraudedetectie binnen dat systeem uitvoeren, en ondersteunende schrijvers van applicaties die een aantal zeer innovatieve dingen doen op het gebied van fraudedetectie, er stromen slechts enkele duizenden betalingstransacties per seconde door zelfs de grootste betalingsprocessors. En toch, toen het eerste bedrijf naar ons toekwam en zei dat ze aan het kijken waren naar het gebruik van NoSQL, en wilden zien hoe onze oplossing eruit zou zien als basis voor hun applicatie, zeiden ze dat ze 5000 stukjes gegevens wilden aanraken in een venster van 750 milliseconden. Welnu, opeens heb je een paar honderd zakelijke transacties en een paar duizend stukjes gegevens om te overwegen bij elke berekening, en nu ben je op het punt dat je miljoenen transacties per seconde nodig hebt.

Het geval van - even reclame opzij zetten, het geval van fraude is fascinerend, want waar geld is, is fraude en realtime fraudepreventie, in tegenstelling tot analytisch proberen te sorteren nadat er fraude is gebeurd, is echt een kwestie van zoveel mogelijk gegevens online brengen, en je kunt het zien als een weerspiegeling van die VIP-ervaring. Gedraagt ​​deze persoon zich op een manier die ze zich meestal niet gedragen? En dus stijgt de kans dat het een frauduleus systeem is, en niet echt deze persoon. Heeft deze persoon meestal toegang via een bepaald apparaat of een reeks apparaten, met een bepaalde reeks schermresoluties? Vertonen ze meestal een bepaald gedragspatroon? Misschien kunnen we tijdens de transactie zelf fraude in de kiem smoren. Dat zou u veel moeten herinneren aan het soort dingen dat gebeurt binnen een transactie in het advertentiesysteem.

Het soort systemen dat we oplossen, is een systeem waarbij elke afzonderlijke betalingsprocessor een groot gegevensteam heeft, ze hebben veel historische gegevens, ze maken nieuwe modellen, ze delen niet met ons op Aerospike alle modellen, omdat ze zijn echt een geheime saus. Als u abonnee bent van Gartner en u Gartner over de algoritme-economie hoorde praten, is dit één algoritme en één bedrijf dat het tegen elkaar opneemt om fraude te verminderen en het aantal succesvolle transacties te verhogen, omdat u ook geen ' t wilt transacties blokkeren. Dat soort projecten zoeken we in Aerospike op deze schaalniveaus.

Een ander geval waar we met financiële dienstverleners aan hebben gewerkt, is het zogenaamde Intraday System of Record. In dit geval is wat er gebeurt, het soort rijkere ervaring, zelfs in een retailhandelssysteem, is een ervaring waar ik naar mijn specifieke positie wil kunnen kijken en ik wil dit uiterst nauwkeurig doen. Ik wil geen vangst voor mijn DB2-systeem hebben. In plaats daarvan wil ik naar de exacte gegevens kijken, en tussen mobiel, maar ook dingen zoals een risicoherberekening, risicoherberekeningen moeten nu van minuut tot minuut worden gedaan, je wilt ieders risico kunnen herberekenen, evenals het globale risico, het systeemrisico binnen het hele bedrijf binnen enkele minuten.

En nogmaals, het is hetzelfde probleem. Elk account dat een bepaald is, beschouw het als een sleutelwaarde voor een bepaald object, dan kan dit parallel worden gedaan en het belangrijkste is dat dit paradigma u toestaat uw code en uw algoritmen in een taal op hoog niveau te schrijven, die gemakkelijker te debuggen is en een snellere time-to-market. In deze algoritme-economie moet ik nu mijn algoritmen online kunnen krijgen. Dit is een heel ander probleem voor het modelleren en zakelijke relaties, dat is waar relationele systemen goed in zijn. Wanneer u een tabel met onderdelen hebt, en die onderdelen zijn gekoppeld aan bestellingen, en die bestellingen zijn gekoppeld aan mensen, hebt u een bedrijfsproces dat strikt kan worden gemodelleerd en waarschijnlijk niet zal veranderen gedurende de levensduur van uw bedrijf. Een nieuw algoritme om een ​​nieuw fraudepatroon te vinden, moet echter nauwkeurig en snel worden geschreven en online worden gezet, waardoor zakelijke beslissingen op zijn minst binnen enkele dagen, zo niet sneller, worden genomen. Een NoSQL-oplossing voor dit soort opnamesysteem is echt een geweldig systeem voor deze jongens, omdat het hen in staat stelt zeer snel gegevens in te nemen en nieuwe algoritmen te bouwen, dus niet alleen een nieuwe klantervaring in het adresseren van mobiel, maar echt het bouwen van een breed scala aan nieuwe applicaties.

Wat we op de lange termijn zien bij Aerospike is het feit dat elk databasetype, elke fysieke lay-out van gegevens op schijf zijn eigen componenten heeft, en bij Aerospike zijn we echt gefocust op dit kernwaarde- of rolgeoriënteerde systeem, zoals Robin zei, met een hoge transactionele consistentie, en staan ​​echt mensen toe zoals kolomwinkels en grootschalige datameren en ook hardcore transactionele systemen die rapportagebeperkingen hebben opgelegd. We zien dat ze allemaal in verschillende query-engines moeten worden ingevoerd. We zien enkele van de op JSON gebaseerde query-engines. We zien dingen als elastisch zoeken, we zien Spark, die allemaal verschillende variëteiten nodig hebben op verschillende momenten van dingen als kolomwinkels, en rijwinkels, dat is waar Aerospike uitblinkt.

We zien echt dat deze verschillende soorten en de industrie op een punt komen dat het kiezen van het beste van het ras van elk van deze een noodzaak zal zijn. Helaas, vanwege de realiteit van langetermijnanalyses en batches versus analyses en operationele beperkingen, komen we waarschijnlijk niet op het punt om een ​​enkele, one size fits all te hebben, maar we komen op het punt om om duidelijk te kiezen tussen enkele van de kerngegevenslay-outs.

Laten we het even hebben over de innovatie van flash. Ik krijg de vraag nog steeds, ook al is Flash, zoals eerder werd opgemerkt, al lang bij ons. Toen we in 2009 met Aerospike begonnen, toen, denk ik, 2009, misschien, ja, 2009 was toen Intel uitkwam met de X25, wat echt de eerste massale SATA-bemande flashdrive was, en daarvoor waren een aantal flitssystemen, maar echt dat was degene die in het bewustzijn van veel technologie ingebroken was. Fusion-io bracht daarna echt flits op de bredere zakelijke markt.

Wat er nu gebeurt is de komst van een systeem genaamd NVMe. NVMe is een standaard vergelijkbaar met SATA of SAS of zelfs SCSI waarmee verschillende kaartleveranciers op een hoog efficiëntieniveau kunnen samenwerken met stuurprogramma's binnen het besturingssysteem. Het creëert dus een hoger prestatieniveau, in de eerste plaats omdat NVMe is gebaseerd op PCIE als het onderliggende transport, dat veel sneller is dan SATA, SAS of iets anders, maar het biedt ook best-of-breed stuurprogramma's.

Binnen Linux is er bijvoorbeeld deze kerel Jens, en Jens is de NVMe-stuurprogrammagids, Jens expo, en hij doet het beter dan elke individuele tn Intel of Fusion-io met hun individuele stuurprogramma had kunnen doen, met al hun middelen. Als je de kracht van het besturingssysteem zelf hebt om de beste driver te bouwen, zien we een aantal echt geweldige prestatieniveaus. Dit alles ondersteunt het idee dat flash echt veel van de lage latentie van RAM kan bieden.

Nu is Aerospike nog steeds een geweldige RAM-database vanwege het clustermodel, maar we zien dat als u eenmaal een netwerkhop uitvoert, waarvoor u schaalbare opslag nodig hebt, u al ten minste vijf tot 50 microseconden uitgeeft, de extra 70 microseconden van NAND is meestal geen belemmering, en je kunt net zo goed flash gebruiken, gezien die NAND-flash, gezien het feit dat het netwerk daar al bij betrokken is. Veel mensen vragen zich dan af hoe - dit klinkt allemaal geweldig als je je eigen hardware koopt, hoe gaat het met de public clouds? Ik denk dat je nu meteen zult vinden, ongeacht welke publieke cloud je gebruikt, die openbare clouds hebben een zeer sterk flash-aanbod. Het verschilt wel een beetje van cloudprovider naar cloudprovider. Amazon heeft zijn I2-exemplaren die al zijn uitgebracht, denk ik nu een jaar, twee jaar nu, dat zijn echt behoorlijk hoge kwaliteit flitsontwerpen, en Aerospike heeft het implementatiepatroon er bovenop.

Ik zou Google Compute, Google Compute Engine en Google Cloud specifiek willen noemen, omdat onze ervaring tot nu toe enkele van de apparaten met de hoogste prestaties en een aantal van de meest flexibiliteit in termen van inzetpatronen heeft. Maar je ziet ook nieuwe implementatiepatronen zoals Pivotal, wat een soort van publiek / privaat is, dus je kunt juiste Pivotal-apps doen op beide plaatsen die flash ondersteunen en verschillende opslagapparaten ondersteunen, evenals Docker-patronen. Dus echt, dit is een punt in de geschiedenis waar Flash niet alleen beschikbaar is voor u om te kopen en in uw datacenters te plaatsen, maar echt is verzonken in alle infrastructuuraanbieders, omdat het echt de beste manier is om high-IOPS-systemen te krijgen bij een zeer redelijke latentie.

Even een moment over Aerospike - Aerospike is een cluster-gedistribueerde database, waardoor het zeer geschikt is voor cloud-achtige implementaties en datacenters. We vinden dat de flexibiliteit van het kunnen toevoegen van meer gegevens en meer prestaties absoluut noodzakelijk is in dit soort netto nieuwe toepassingen omdat u een project start, u weet niet of u vijftigduizend transacties per seconde, honderdduizend, een nodig hebt miljoen, twee miljoen, dus je wilt jezelf wat ruimte geven om servers toe te voegen. En toch wilt u opschalen zodat elke server op zichzelf snel kan zijn. U wilt niet echt eindigen met vijfhonderd of duizend servers die trage databaseservers zijn. Scale out is niet het enige spel in de stad, het is schaalbaar en schaal op, zoals Dez al eerder zei, er is een nieuwe Z-as.

Hopelijk geeft dat je een aantal nieuwe ideeën over hoe snelheid en schaal nieuwe markten aanpakt en misschien zijn er projecten waaraan je werkt, waar je kunt overwegen om echt rijkere applicaties te bouwen en een applicatiekader te gebruiken met een meer belangrijke waarde of NoSQL-database eronder. Bij Aerospike heb ik zeker veel van onze klanten en veel van onze open source-gebruikers met dat patroon zien slagen, en ik kijk ernaar uit dat de industrie het in grotere mate zal overnemen.

Rebecca Jozwiak: Heel erg bedankt Brian, en ik weet zeker dat Dez en Robin enkele goede vragen voor je hebben. Robin?

Dez Blanchfield: Ik ben blij om erin te springen. Robin, heb je een vraag? Anders kan ik snel beginnen.

Robin Bloor: Sorry, ik was op mute. Ik dook erin, maar niemand hoorde me. De vraag kwam meteen bij me op, omdat dit een zeer geavanceerde reeks technologische mogelijkheden is. Wat betreft de bestaande klanten die u heeft, wat is het soort escalatie of transactieratio dat u ervaart met betrekking tot sommige van deze advertentietoepassingen? Blijft de transactieratio stijgen? En zo ja, tegen welk tarief?

Brian Bulkowski: Interessante vraag, Robin. Elke branche heeft zijn eigen curve in elk bedrijf. Laten we Noord-Amerikaanse advertenties nemen, zeg maar 2012, Noord-Amerikaanse advertenties waren waarschijnlijk dichter bij 200.000 advertenties per seconde, in een soort standaard intraday, niet mijn tijd, en het is nu waarschijnlijk geëscaleerd tot ongeveer drie tot vijf miljoen advertenties per seconde. Maar toen gebeurde er iets interessants. De advertentie-industrie begon enkele fraudeproblemen aan te pakken, en de delen van de industrie die in staat zijn om fraude te blokkeren, zagen de transactietarieven een beetje dalen, ongeveer een factor twee, bij sommige van onze meer geavanceerde klanten die in staat waren fraude vast te stellen. Natuurlijk moesten ze wat database-opzoekingen doen om fraude te blokkeren, dus uiteindelijk is het soort van hetzelfde.

Een interessante use case is binnen telecom, ik heb dat niet echt gezegd, telecom zag transacties toenemen door facturering op basis van elk pakket dat het mobiele telefoonnetwerk passeert. Vroeger hadden we gedetailleerde gegevens van oproepen en één keer per minuut, wat je weet, zou een kleine ping door het netwerk gaan en heeft deze man nog een minuutje over? Nu moeten we bouwen en zelfs routeren op basis van elk pakket op internet. Dat is jammer in een mobiel netwerk, dat nu ineens miljoenen pakketten per seconde heeft en iets dat steeds maar weer groeit. Eén geval is dus dat elke toepassing een aardig klein soort 2x per jaar rijdt. Bij sommige klanten zien we: 'Maar wacht, ik heb een nieuwe applicatie. Ik wil wat fraude toevoegen aan mijn risico. Ik wil wat diepere klantervaring toevoegen aan mijn fraude en mijn risico. ”Elk van hen zorgt voor een nieuwe belasting van de onderliggende database.

Robin Bloor: Ja, ik bedoel, ik denk dat dat was waar ik naar heb gesuggereerd in de korte presentatie die ik gaf, dat deze - we dachten altijd dat een transactie is, iemand doet iets en misschien is er een cascade van gebeurtenissen en het wordt allemaal opgenomen, en nu hebben veel transacties een enorme hoeveelheid zoekopdrachten, en u gaf enkele voorbeelden in de presentatie. En daarom voert u eigenlijk geen transactie meer uit, maar voert u in feite een soort toepassing uit die veel, veel elementen kan bevatten.

De andere vraag voordat ik deze overgeef aan Dez - omdat we hier duidelijk teamwerk aan toevoegen - de andere vraag die ik graag zou willen beantwoorden als je er een redelijk antwoord op hebt, is zowel Dez als ik verwacht dat het internet van Things, of het Internet of Everything zoals het soms wordt genoemd, om een ​​vrij dramatische hoeveelheid transactieverkeer te creëren. Kun je daar tegen spreken? Is dat je ervaring, heb je klanten naar je toe komen met dat specifieke soort probleem, en wat is je mening hierover op dit moment?

Brian Bulkowski: Natuurlijk, ik denk dat er een beetje verwarring is, en dat is op zijn zachtst gezegd, over Internet of Things. De klanten die ik tot nu toe zie, brengen internet gewoon naar de dingen die ze hebben. Denk aan die Amazon-knoppen - het is allemaal Amazon - die knoppen, je kunt ze niet opnieuw gebruiken en ze online naar Walmart laten gaan. Het is niet zoals een browser die je kunt mixen en matchen. Aan de andere kant gebeurt er machine-to-machine, en wanneer je je Tesla-auto aansluit om hem op te laden, stuurt Tesla een enorme terugstroom van informatie, elke sensor naar de auto, maar deze stroomt in de computer van Tesla voor analyse en verbetering kwaliteit. Wat ik zie, is al die machine-to-machine en alle sensoren binnen een individueel bedrijf, wat nieuwe eisen creëert.

Nu meestal vandaag, dat stroomt in deze analysesystemen, en neem het geval van Tesla; Tesla's eerste gebruik daarvan, naar mijn begrip, was om de levensduur van de batterij te verbeteren, onder "Welke operationele temperaturen zijn ze, wat zijn de belastingen?" Laten we ernaar kijken, laten we een betere batterij ontwerpen. ”Maar dan beginnen ze te denken, en dat is allemaal geweldig, dat is een soort diep analyseprobleem dat fascinerend is, de volgende vraag is:“ Hoe verbeter ik de ervaring van moment tot moment? ?”

Laten we nu het geval nemen zoals Nest, waar je voorspellende analyses probeert te maken om de temperatuur van een huis van moment tot moment te veranderen. Dat is het soort geval dat we in Aerospike gaan zien, waar er een enorm datameer is en enorme analytische processen, maar wat ga ik nu doen? Ik zal het moeten houden, denk aan het geld, een deel van de afgelopen week, de laatste maand, misschien zelfs alleen de waarde van de laatste dag aan informatie, waarschijnlijk op een back-end omdat we te maken hebben met eenvoudige sensor apparaten, en ik ga op dat moment een aantal analyses doen om ervaringen te veranderen. Dat soort Nest-achtige ervaringen, waar ik Aerospike-cases voor zie.

Robin Bloor: Oké, het ding dat ik verwachtte met Internet of Things, was dat je drempeltriggers zou krijgen en dat ze cascades van evenementen zouden beginnen te maken. Heb je zoiets gezien of ben je dat nog niet?

Brian Bulkowski: Dez en ik waren - ik vroeg de mening van Dez daarover toen we pre-show chatten. Wat ik nog niet heb gezien, is het soort cascade van gegevens van het ene bedrijf in een ander bedrijf, dat mijn Samsung-koelkast tegen mijn LG-wasmachine praat omdat het er net achter kwam dat ik een hele hoop chocolade over de vloer had gemorst, dus dat soort bedrijf van apparaat naar apparaat, denk ik dat ik daar nog steeds op wacht in termen van Internet of Things. Ik denk dat er enkele problemen in het bedrijfsleven en beveiliging zijn die meestal niet-technisch zijn en die moeten worden beantwoord om dat te zien.

Robin Bloor: Oké, Dez?

Dez Blanchfield: Ik heb een aantal zeer sterke opvattingen over dat laatste laatste punt, dat ik maar kort in het gesprek zal brengen. Ik denk dat bedrijven en technologie vaak denken dat ze daadwerkelijk rijden waar de vraag vandaan komt, maar als we kijken naar wat er gebeurde toen de iPhone een ding werd, en in mijn gedachten was het een soort van het eerste mobiele apparaat, als je me wilt vergeven de woordspeling, maar een apparaat dat kan worden meegenomen en dat in feite veel kleine apps in je zak kan uitvoeren, en het heeft een belangrijke transformatie teweeggebracht in wat we dachten dat het een computer was. Veel mensen denken aan iPhones of smartphones, of Android-telefoons als telefoons, maar dat zijn ze niet, het zijn eigenlijk maar een kleine computer die apps uitvoert, en een van de apps die hij uitvoert, belt, en ze zijn niet de telefoontjes waar we meer aan denken, ze zijn geen analoge point-to-point-oproep zoals Brian benadrukte, het zijn kleine pakketjes die worden rondgeleid.

Maar vaker wel dan niet, hebben we gezien dat deze opkomst van smartphones eigenlijk niet echt wordt gebruikt om te bellen, waarschijnlijk 98% van wat ik op mijn smartphone doe, is niet bellen. Het is alles behalve oproepen, het zijn apps. Ik denk dat dit trapsgewijze effect - en ik wil dit snel op een vraag stellen - maar het trapsgewijze effect wordt eigenlijk veroorzaakt door consumenten, en in feite heb ik deze voering die ik vrij vaak weggooi om een ​​heleboel CXO's te krijgen rechtop zitten in de kamer en opletten als ik denk dat ze in slaap vallen met de presentatie die ik doe, wat hopelijk niet vaak gebeurt.

Ik heb het soort gezegd in die verstoring die je in je bedrijf ziet, eigenlijk niet uitsluitend door technologie wordt aangedreven, maar vaker dan niet door je klanten. En ze gaan een beetje rechtop zitten en vragen zich eigenlijk af, wat bedoelt hij daar? Dus als ik denk aan het gebruik van technologie, bedoel ik dat we USENET hebben gezien, we zagen al dit soort leuke dingen gebeuren op internet, maar niet veel mensen voorspelden sociaal, en de impact ervan. Iedereen wil iedereen vertellen wat ze voor het ontbijt hadden, en het lawaai dat dat veroorzaakte en de backend-technologie die we hadden, en dan probeert reclame natuurlijk om het met dingen te vullen.

Ik denk dat we een trapsgewijs effect gaan zien tot een punt waarop apparaten met apparaten praten, consumenten zijn gewoon aan het inhalen wat dat eigenlijk betekent en wat dat kan. Je hebt een interessant punt aangekaart waarom de Amazon-knop niet met Walmart praat. Ik ga deze vraag posten, wat gebeurt er als Walmart hun eigen knop krijgt, en wat als de top twintig Amazones en Walmarts en andere grote distributie- en retailnetwerken allemaal hun eigen knoppen krijgen? Waar brengt dat ons naartoe? In het bijzonder zal mijn vraag met Brian zijn: “Waar gaan we heen met dit geheel nieuwe paradigma van prestaties? U bevindt zich op de rand ervan en u werkt samen met bedrijven die dit zowel op het niveau van de fysieke infrastructuur als op het niveau van de overdracht van gegevens doen. Waar brengt dit ons heen, wanneer deze volgende grote golf komt? Wat voor soort inzicht kun je daarover delen met wat er gebeurt aan de achterkant van je ervaring? '

Brian Bulkowski: Natuurlijk, de manier waarop ik over veel van deze dingen denk, is om te focussen op de gebruikerservaringen en precies wat je zei, het zijn de gebruikers die rijden, hoewel we als technologen en als zakenmensen misschien met een slim idee waarvan we denken dat de gebruikers het leuk vinden, en ik ga een beetje terug naar het Nest-voorbeeld. Toen mijn zus Nest in haar huis installeerde, zei ze: 'Mijn huis is stiller, ik kan dingen horen. Het is niet alleen dat ik minder betaal voor stroom, 'is ze, maar je kunt dat Nest nu niet uit haar handen rukken omdat ze graag in een rustiger huis is in tegenstelling tot een waar de verwarming maximaal blaast en dan weer uit te schakelen.

De vraag is uiteindelijk, wat zijn de gebruikerservaringen die we kunnen versterken? Dat is uiteindelijk die kwaliteit van leven, dat als we het geld hebben en we in de eerste wereld zijn, we er veel voor zouden betalen. Ik geef je een voorbeeld uit mijn eigen huis, mijn vriendin houdt van koude melk. Ze houdt echt van koude melk, en zo vaak moeten we proberen uit te zoeken waar in de koelkast het koud genoeg zal zijn, en niet de rest van de dingen oververhit raken. Welnu, dit is geweldig - en ik zei tegen mijn vriendin: "Zou je $ 10 per maand betalen voor koude melk en geen bevroren vleeswaren?" Ze zei: "Absoluut." En elke maand $ 10 krijgen van een consument is moeilijk.

Ik denk dat we in deze ervaringen echt in de gaten moeten houden wat die consument-eindervaring is die echt kan worden aangedreven. Ik denk dat dat deel uitmaakte van het geheim van de iPhone. Ik denk dat het deel uitmaakt van het geheim van Tesla om een ​​betere auto te bouwen met alle gegevens, het idee van een productcyclus en een jaarlijkse release af te schaffen en voortdurende verbeteringen aan elk onderdeel aan te brengen. We moeten een aantal slimme ideeën bedenken om al deze gegevens daadwerkelijk te gebruiken op een manier die van moment tot moment dwingt tot het leven van mensen.

Dez Blanchfield: Ja, dat is geweldig inzicht. Daaruit voortkomend, het andere einde van het spectrum, dat precies overeenkomt met het soort dingen dat we nu zien met wat consumenten vragen, en we hebben allemaal iets in huis dat het koud heeft en warm van. Het andere einde van het spectrum is dan, en we hebben dit gezien in een soort van de traditionele 'big data-wereld' waar data-opdrachten zeldzamer worden dan die van hen en die op de markt worden aangeboden meer dan de CIO's verdienen in sommige gevallen, het soort bedrijven waarmee je werkt en de soorten ontwikkeling die je hebt gezien, is het zo dat de soorten ontwikkelaars en het type data-architect en de netwerkspecials steeds moeilijker te vinden zijn ? Moeten organisaties nu beginnen na te denken over het vooruitlopen van de curve van het type vaardigheden dat ze nodig hebben aan de achterkant voor het type ontwikkelaars en data-architecten? Wat zie je op dat niveau voor zover de vaardigheden die ze zullen begrijpen hoe ze deze technologie nu goed kunnen gebruiken?

Brian Bulkowski: Ja, ik denk dat dit een van de uitdagingen is voor de organisaties waarmee ik heb gesproken. Of het nu een van de ergste problemen is waar ik over heb gehoord, is eigenlijk een soort grotere ondernemingen, want als je zegt: "Ik ben van deze grote bank, ik kom uit Chase en ik was een data-architect, " dan ben je ' je hebt de wereld van je oester en je salaris gaat omhoog, dus er is dit churn-probleem van het vinden van een baan op een van die plaatsen omdat er niet genoeg mensen zijn en dan gewoon van baan naar baan kunnen gaan. Ik hoor niets anders dan dat soort problemen, en dat is eigenlijk een van de redenen waarom ik Aerospike heb geconcentreerd op het gebruik van tooling die geschikt is voor het specifieke projectteam.

In plaats van te proberen een projectteam binnen te lopen en te zeggen: "Hé, je zou onze zoektaal moeten gebruiken." Kijk, als die jongens tegenwoordig in de bus rijden, jongens en meisjes, en als ze een bepaalde vraagtaal gebruiken en tooling, daar blijven ze bij en ik kan ze nergens anders over vertellen. Mijn doel is om het soort Aerospike-kracht als database te kunnen plaatsen achter de tooling die ze gebruiken en dat is onderdeel van dit idee, de dia's die je ziet over de toekomst van de Poliglot-database. Ik moet de patronen van toepassing en analyse tussen deze jongens ondersteunen, omdat het echt moeilijk is om mensen te vinden met de wiskundige achtergrond en de statistische mogelijkheden om door deze wereld te navigeren.

Dez Blanchfield: Nog iets interessants waar mensen zich misschien niet van bewust zijn, ik bedoel Aerospike is een zeer sterke speler in de open-source wereld, ik wil graag een zeer snel inzicht krijgen in wat dat betekent voor zover de bedrijf werkt en wat het voor u doet. Je zei dat je rechtstreeks samenwerkte met mensen die dingen doen tot op het kernelniveau binnenin, dus de Linux-kernel. Er zijn enkele grote spelers in deze ruimte, en er zijn enkele beroemde merken die we niet zullen noemen, maar een organisatie als Aerospike, in je modernere recente geschiedenis, de open-source ervaring, hoe past dat in het grote geheel? en welke concurrentievoordelen heb je gezien die je opleveren?

Brian Bulkowski: Natuurlijk, toen we in 2014 overstapten naar open source, deden we het omdat we ons realiseerden dat een kerninfrastructuur, zoals een database, beschikbaar moet zijn als bron, dat het vertrouwd moet worden en een natuurlijk tegenwicht tussen de oude wereld van gesloten bron, en als je eenmaal in een bepaalde database investeert, hebben die jongens je overgeleverd aan technologiecyclus na technologiecyclus, en er moet een balans zijn. We moeten in staat zijn om versies uit te brengen die nieuwe dingen doen, en misschien is dat in een enterprise-versie, we hebben een dual-licentiemodel nodig met een open-source versie voor mensen die tegen de banden schoppen die non-profit werk doen, evenals een enterprise-versie die een eigendomslicentie is en onbeperkt werk toestaat.

En natuurlijk zullen we ook de hoogste niveaus van snelheid en schaal hebben, als een enterprise-versie. Wij geloven in het duel-licentiemodel en dat is geweldig voor ons bedrijf. We willen dat mensen aan de slag gaan met Aerospike, we willen dat kleine projecten de banden schoppen, het is super eenvoudig om gewoon naar Amazon te gaan, een bevestigingsscript te starten en binnen vijf minuten een Aerospike-cluster te hebben. Anderzijds willen we meer geven aan de zakelijke klanten.

Dez Blanchfield: We komen bijna aan het einde van het uur, dus ik ga zo meteen terug naar Rebecca, maar als er maar één voering was die je daar zou weggooien, soort advies je zou geven aan mensen die op zoek zijn naar de ruimte van de technologie die je op de markt hebt gebracht en hoe ze het gaan adopteren, wat zou je zeggen dat de eerste stap voor hen is om en gaan kijken hoe ze een concurrentievoordeel van uw platform krijgen?

Brian Bulkowski: Natuurlijk, een deel van de boodschap hier is dat er snelheids- en vaardigheidsniveaus zijn die nu eenvoudig zijn. U hebt geen Cassandra-cluster met duizend knooppunten nodig om miljoenen transacties per seconde te realiseren. Je kunt het zelfs in de eerste fasen van je project doen. Dus dingen zijn een stuk eenvoudiger dan vroeger. Het tweede advies is dat u, net zoals u zegt, met klantbetalingsmodellen voor wiskundebedrijfsprocessen moet komen die gebruikmaken van al deze gegevens, dus het goede nieuws is dat de gegevens beschikbaar zijn, de slecht nieuws is dat je eigenlijk enkele patronen en een aantal overtuigende use cases moet gaan zoeken.

Dez Blanchfield: Ja, goed advies, dus ik ga nu terug naar Rebecca. Heel erg bedankt daarvoor, het was een geweldig praatje over de technologie, ik waardeer het.

Rebecca Jozwiak: Bedankt, Dez. Ik heb een paar goede vragen van het publiek. Laat me deze dia overgeven. Ik weet dat je het hebt gehad over het systeem van record- en mainframespullen, maar hoe vaak zie je absolute ontlading of is de replicatie een verzoening aan het einde van de dag, iets waar je meer van ziet?

Brian Bulkowski: Wat we in Aerospike zien, is het gebruik van een NoSQL-database voor dat verzoeningssysteem aan het einde van de dag. Je hebt intraday nodig, het juiste antwoord. Je kunt niet het verkeerde antwoord hebben, en dat is wat Robin zei over activa wordt ondergewaardeerd, maar de bedrijfsprocessen rond de wettelijke vereisten van verzoening kunnen behoorlijk gecompliceerd worden en er is tientallen jaren technologie en tientallen jaren wet en praktijk rondom verzoening. Dus wat we bij Aerospike zien, is dat je je algoritmen gaat doen in een heter database met meer transacties per seconde. Maar om juridische redenen hebt u absoluut een verzoeningssysteem nodig dat deze juridische processen heeft doorlopen. We zien beide, en we zien dat dit in wezen de tweedelige IT-praktijk is die tot op zekere hoogte wordt onthuld door mensen zoals Anderson Consulting en Gartner. We zien daar veel van.

Rebecca Jozwiak: Oké, goed. Iemand anders toonde interesse in deze specifieke dia, hij zei dat het echt interessant was en vroeg zich af of je gewoon een beetje meer vergelijking zou kunnen maken tussen flash versus in-memory.

Brian Bulkowski: Natuurlijk, laat me een snelle zijstaaf nemen, nogmaals, ik weet dat we bijna aan het einde van de tijd zijn. Wel, flash is geheugen - het zijn chips - ik denk vaak aan RAM. RAM heeft dus specifieke kenmerken, vereist veel kracht, het is erg goed in willekeurig schrijven en willekeurig lezen. Waar NAND in staat is om snel willekeurig te lezen en minder vermogen te gebruiken, maar het is erg slecht bij willekeurig schrijven. Er zijn enkele subtiele verschillen in de werking van deze twee chips op lithografieniveau, die een aantal technische verschillen veroorzaken.

In het geval dat u analyses uitvoert en u veel gegevens moet overslaan, of in het geval van Aerospike, waar u indexen hebt, zijn indexen nog steeds erg goed in RAM vanwege parallellisme en willekeurige toegang. Een hoger niveau van willekeurige toegang is vereist. In Aerospike vinden we echter het gebruik van die indexen om een ​​bepaald object of een deel van de gegevens te vinden, dat is de juiste plaats om een ​​NAND te bereiken, omdat het een soort grotere winkel wordt onder de indexen. Dat is dan één transactie naar een opslagapparaat, maar nog steeds na het doen van veel mogelijkheden en filters binnen uw indexeringssysteem.

Rebecca Jozwiak: Oké, goed. En dan weet ik dat we al veel over het IoT hebben gesproken en een opmerking van een deelnemer zei dat IoT grotendeels nuttig is, maar groeien bedrijven, overheidsentiteiten en ontwikkelaars veilig en beveiligen ze gegevens in hetzelfde tempo, denk je?

Brian Bulkowski: Misschien Dez, wil je erin springen?

Dez Blanchfield: Ja, ik ben blij daar in te springen. Ik denk dat het antwoord nee is. In feite is een van mijn favoriete wegwerpregels over dit onderwerp heel, heel kort dat ik denk dat de explosie van machine naar machine en algemeen internet der dingen, communicatie en de beveiliging, het risico eromheen, we nu op het punt zijn overheden kunnen de snelheid van verandering niet bijhouden. En in feite weten we dat veel organisaties de snelheid van verandering niet kunnen bijhouden. In feite, als ik het parafraseerde, is de snelheid van verandering vandaag zo groot dat de organisaties moeten sprinten om bij te houden, maar ze moeten in meerdere races sprinten. Ik denk niet dat de wet, en ik denk niet dat de overheid in het algemeen, noch op staatsniveau, noch op federaal niveau, de snelheid van verandering kan bijhouden.

Nu, mijn algemene advies aan mensen is nu een soort daad en vraag later om vergeving. Daar zijn in het verleden veel voorbeelden van geweest. Ze zullen het inhalen, maar ik denk dat het nu echt aan bedrijven en technologieleveranciers is om op deze manier te innoveren en ervoor te zorgen dat we bekend zijn met de beveiligingsrisico's of privacyrisico's en daar moeten we mee omgaan. Met name banken, zoals u al zei, wanneer u nadenkt over wat een bankorganisatie traditioneel heeft gedaan met dingen als anti-witwaspraktijken en uw klant kent, de AML / KYC-uitdaging, was het vroeger dat we elke drie tot vijf jaar probeerden en voldoen aan compliance.

Nu denk ik dat dit in elke transactie moet worden ingebouwd. U bent altijd in staat geweest om dat op biedniveau te doen met reclame en aandelen- en obligatie- en aandelenhandel. Ik denk dat we op het punt zijn dat de prestaties die u met het Aerospike-platform teweegbrengt ons in staat stellen nu na te denken over privacy, hoe brengen we beveiliging in die directe realtime beslissingsketen? En dus is het antwoord nee, ik denk niet dat overheden het bijbenen. Ik denk dat bedrijven het moeten bijhouden, en ik denk dat we nu moeten handelen en later om vergeving moeten vragen.

Brian Bulkowski: Laat me ook een paar punten toevoegen. De jongens waarmee ik omga, de technologiebedrijven waarmee ik omga, weten heel goed of ze aan de rechterkant van de wet staan, en een behoorlijk deel van de discussie is, is deze PII, kan ik dit gebruiken, hoe Gebruik ik dit specifieke stuk gegevens? Wat was de voorzienigheid ervan en is dit een beschermde beslissing of ervaring? Hoe doe ik dat allemaal? Dus dat is het goede nieuws. Ik vraag me wel eens af over onze discussie als samenleving rond waar we naartoe gaan, en of zelfs onze maatschappelijke discussie op het juiste niveau is in termen van het gebruik van de nieuwe mogelijkheden van IoT tot en met machine learning, wat de enige manier is om de hoeveelheid gegevens die we hebben te sorteren. Maar het goede nieuws is dat de jongens met wie ik sprak echt aan de goede kant staan ​​om te proberen goed te doen door de wettelijke beslissingen die we hebben genomen.

Rebecca Jozwiak: Dat zijn een paar echt goede antwoorden van jullie beiden, en ik ben het daar helemaal mee eens. Ik denk niet dat beveiliging sneller gaat dan technologieontwikkeling, vooral als het gaat om Internet of Things, maar ik moet denken dat mensen hun best doen en hopelijk komen we daar. Het is altijd een beetje moeilijk om cyberdieven en cybercriminelen tien stappen voor te blijven, maar we komen er wel.

Nou mensen, we zijn acht minuten voorbij de top van het uur gegaan. Ik wil onze gasten Brian Bulkowski van Aerospike en Dez Blanchfield en Robin Bloor bedanken. Heel erg bedankt. Je kunt onze archieven altijd vinden op insideanalysis.com, SlideShare, YouTube, we hebben veel goede webcasts in de wacht, mensen, het was een drukke maand. Het wordt volgende maand een drukke maand, dus houd ons in de gaten en we hopen je de volgende keer te zien. Bedankt mensen, tot ziens.

Differentiatie wordt zichtbaar: een nieuw tijdperk van schaalbare infrastructuur komt eraan