Q:
Waarom is het belangrijk dat datawetenschappers transparantie zoeken?
EEN:Transparantie is in wezen belangrijk in data science-projecten en machine learning-programma's, deels vanwege de complexiteit en verfijning die hen drijft - omdat deze programma's "leren" (het genereren van probabilistische resultaten) in plaats van het volgen van vooraf bepaalde lineaire programmeerinstructies, en omdat het kan moeilijk zijn om te begrijpen hoe de technologie conclusies trekt. Het 'black box'-probleem van algoritmen voor machine learning die niet volledig door menselijke beslissers kunnen worden verklaard, is op dit gebied een groot probleem.
Met dat in gedachten zal het kunnen beheersen van verklaarbaar machine learning of “verklaarbare AI” waarschijnlijk een belangrijk aandachtspunt zijn in hoe bedrijven talentwerving nastreven voor een datawetenschapper. DARPA, de instelling die ons internet heeft gebracht, financiert nu al een onderzoek van miljoenen dollars in verklaarbare AI, om de vaardigheden en middelen te promoten die nodig zijn om machine learning en kunstmatige intelligentie-technologieën te creëren die transparant zijn voor mensen.
Een manier om erover na te denken is dat er vaak een "geletterdheidsfase" van talentontwikkeling en een "hyperliteracyfase" is. Voor een datawetenschapper zou de traditionele geletterdheidsfase kennis zijn over hoe machine learningprogramma's samen te stellen en hoe te bouwen algoritmen met talen zoals Python; hoe neurale netwerken te bouwen en ermee te werken. De hyperliteracy-fase zou de mogelijkheid zijn om verklaarbare AI onder de knie te krijgen, om transparantie te bieden bij het gebruik van machine learning-algoritmen en om transparantie te behouden terwijl deze programma's werken naar hun doelen en de doelen van hun handlers.
Een andere manier om het belang van transparantie in de gegevenswetenschap uit te leggen, is dat de gebruikte gegevenssets steeds geavanceerder worden en daarom potentieel indringender in het leven van mensen. Een andere belangrijke aanjager van verklaarbaar machinaal leren en gegevenswetenschap is de Europese algemene verordening gegevensbescherming die onlangs is geïmplementeerd om onethisch gebruik van persoonsgegevens tegen te gaan. Door de GDPR als testcase te gebruiken, kunnen experts zien hoe de noodzaak om gegevenswetenschappelijke projecten uit te leggen, past in privacy- en beveiligingsoverwegingen en in bedrijfsethiek.