Programm

Predictive Analytics World Berlin
13.-14. November 2017, Estrel Hotel Berlin


Predictive Analytics World for Business - Berlin - Tag 1 - Montag, 13. November 2017

08:00 Uhr
Registrierung und Frühstückssnacks
09:00 Uhr
Sessions werden auf Deutsch gehalten
Begrüßung durch den Moderator und Program Chair Martin Szugat
Die Session Beschreibung folgt in Kürze.
Ausführliche Beschreibung
Referent
Martin SzugatDatentreiber GmbH
Geschäftsführer
Datentreiber GmbH
09:15 Uhr
Sessions werden auf Englisch gehalten
EXPO+
Keynote:

For media organizations an understanding of one's audience is key to delivering optimal content. The path to this understanding often runs through logged behavioral data, but can we leverage methods from the world of polling to generate additional insights?

Ausführliche Beschreibung
Referent
Haile OwusuMashable
Chief Data Scientist
Mashable
09:45 Uhr
Sessions werden auf Deutsch gehalten
Sponsor Präsentation

Der Handel ist ein komplexes System, in dem immerzu heterogene Daten generiert werden. Während viele Händler noch mit den Herausforderungen von Omni-Channel-Retail kämpfen, haben sich andere zu Technologieunternehmen gewandelt. Diese Vorreiter extrahieren nicht nur Erkenntnisse und generieren Prognosen aus ihren Daten, sondern sie verändern ihr operatives Geschäft disruptiv. Data Science und Predictive Analytics sind die wesentlichen Faktoren, die diese Transformation antreiben. Dabei kommt der Methode des Deep Learnings eine besondere Rolle zu. Der Vortrag zeigt ausgewählte Beispiele von Deep Learning-Anwendungen für Predictive Analytics im Retail. Neben Deep Learning lernen Sie auch Beispiele für Anwendungen aus dem Bereich der Netzwerk- und Komplexitätstheorie kennen und erfahren, wie diese Methode das Retail-Business nachhaltig verändern.

Ausführliche Beschreibung
Gesponsert von
7LYTIX
10:15 Uhr
Raumwechsel für Kombi-Pass-Teilnehmer
10:20 Uhr
Sessions werden auf Englisch gehalten
Track 1

AutoScout24 is the largest online car marketplace Europe-wide. With more than 2.4 million listings across Europe, AutoScout24 has access to large amounts of data about historic and current market prices and wants to use this data to empower its users to make informed decisions about selling and buying cars. We created a live price estimation service for used vehicles based on a Random Forest prediction model that is continuously delivered to the end user. Learn how automated verification using live test data sets in our delivery pipeline allows us to release model improvements with confidence at any time.

Ausführliche Beschreibung
Referenten
Christian DegerAuto Scout 24
Architect
AutoScout24
Arif WiderThoughtWorks GmbH
Consultant Developer
ThoughtWorks
Sessions werden auf Deutsch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)

Prognosen sind besonders heikel wenn es um Marktpreise geht. Für die Plattform Cargonexx (www.cargonexx.de) wurde einen Pricing Algorithmus aufgebaut mit dessen Hilfe für eingehende Transportanfragen ein Marktpreis prognostiziert wird. Cargonexx ist als Online-Spedition davon abhängig , dass ihre Preise für Auftraggeber attraktiv genug sind, dass aber anschließend Fuhrunternehmen gefunden werden, die die Aufträge zu einem vorgegeben Preis ausführen, d.h. der prognostizierte Preis muss die aktuelle Marktlage auf beiden Seiten möglichst genau widerspiegeln, um das wirtschaftliche Risiko für Cargonexx zu minimieren. In dem Vortrag werden Alwin Haensel und Andreas Karanas vor allem auf die Herausforderungen dieser Aufgabe eingehen und Lösungsansätze dazu vorstellen. Um dieses stochastische Problem zu lösen, werden Fuzzyfizierungen der Beobachtungen und maschinellen Lerntechniken verwendet, um empirische Wahrscheinlichkeitsverteilungen aufzubauen. Dabei liegt der Fokus auf allgemeineren ML-Anwendung, die auch für ähnliche Business Cases mit zugrunde liegenden stochastischen Optimierungsproblemen gelten, wo Wahrscheinlichkeitsverteilungen aus grossen Datenmengen extrahiert werden müssen, um optimale Kontrollmaßnahmen unter Unsicherheit abzuleiten.

Ausführliche Beschreibung
Referenten
Alwin HaenselHaensel AMS
Business Analytics & Founder
Haensel AMS GmbH
Andreas KaranasCargonexx GmbH
Co-Founder and CEO
Cargonexx GmbH
Sessions werden auf Deutsch gehalten
Track 3 - Deep Dive Expert Session (maximal 30 Personen, First Come First Serve!)

Der Wellness-Trend im Bereich Internet der Dinge nimmt ungeahnte Ausmaße an: nahezu wöchentlich kommen neue Apps und dazu passende Hardware auf den Markt. Handelt es sich dabei nur um Spielzeug? Oder kann man diese Apps und Devices auch im Rahmen der Industrie 4.0 für konkrete Geschäftsanforderungen nutzen? Das Projekt WorkRight, durchgeführt in Kooperation mit North Star BlueScope Steel und dem IBM Watson IoT Forschungslabor in Haifa, haben gezeigt, dass die Technologien, die heute im privaten Umfeld verwendet werden, auch in der (Schwer-)Industrie Anwendung finden und Nutzen stiften können. Ziel ist es, mit voraussehender Analyse die Arbeitsplätze sicherer zu machen und gleichzeitig die neuen Arbeitnehmerschutz-Rahmenrichtlinie der EU (89/391/EWG) effizient einzuhalten sowie die Maßnahmen entsprechend zu dokumentieren. Erfahren Sie mehr über die Möglichkeiten von Predictive Analytics und Cognitive Computing im Umfeld der 4. Industriellen Revolution.

Ausführliche Beschreibung
Referent
Marcus KottingerIBM
Solutions Architect Industry 4.0/Life Science
IBM Watson IoT
11:10 Uhr
Kaffeepause
11:35 Uhr
Sessions werden auf Englisch gehalten
Track 1
Teil 1

Text classification is a key ingredient of our data processing stack at Experteer. We decided to benchmark (Recurrent Convolutiona) Neural Networks for extensive classification of jobs to our existing classifiers based on decision trees and SVM. I would be happy to show you what we learned from this and other AI Experiments and how we profit from them in our day-to-day operations.

Ausführliche Beschreibung
Referent
Alexander Chukovskiexperteer
Head of Data Science and Engineering
Experteer
Teil 2

In this case study, we’ll explore the challenges and opportunities faced by Dr. Stephenson when he was brought onboard by Belvilla, an Axel Springer subsidiary and one of Europe’s leading online booking platforms, to launch a completely new data science program during a period of triple digit company growth. We’ll discuss how we formed the analytics strategy, constructed the short- and long-term analytics roadmaps, and selected tooling, technology and vendors. We’ll also talk about how we achieved perhaps the most difficult objective, the recruitment of a top-notch data science team.

Ausführliche Beschreibung
Referent
Dr. David Stephenson
Freelance Data Scientist
Sessions werden auf Englisch gehalten
Track 2 - Deep-Dive Beginners Session (maximal 30 Personen, First Come First Serve!)

Time series data are everywhere: In finance, accounting, sales, IoT (sensor data), operations, production, marketing, economy, ecology … even in our daily lives, where we might measure series of daily calory intake, daily energy consumed, work productivity over the day… and what not. Given the past data, how can we forecast the future? In this session, after a quick look at the classics (random walks, ARMA and ARIMA models) we'll dive into two lesser known but extremely interesting alternatives: Bayesian dynamic linear models (including the famous Kalman filter) and the deep learning approach to sequence modeling, recurrent neural networks (mainly the LSTM). All demos will be available to the participants as R notebooks to play with.

Ausführliche Beschreibung
Referent
Sigrid KeydanaTrivadis
Data Scientist
Trivadis
Sessions werden auf Deutsch gehalten
Track 3 - Deep Dive Expert Session (maximal 30 Personen, First Come First Serve!)

Die Wertschöpfung in der produzierenden Industrie ist heutzutage geprägt von kapitalintensiven Produktionsanlagen, welche sich durch einen hohen Grad an Automatisierung auszeichnen. Dabei liegt es in der Natur der Sache, dass im fortlaufenden Betrieb eine Vielzahl von Daten anfallen. Oftmals werden diese aber nur zur ihrem originären Zweck, dem Steuern und Regeln der Produktionsprozesse verwendet und nicht etwa für weitere Nutzungsmöglichkeiten archiviert.

Im Rahmen des Deep Dive Workshops zeigen wir am Beispiel von Anlagensteuerungsdaten und Sensorik zur Zustandsüberwachung, wie über intelligente Prozess- und Maschinendatenerfassung Smart Services entstehen können, aber auch welche neuen Herausforderungen bezüglich Daten- und Informationsaustausch auf Industrieunternehmen im Kontext Industrie 4.0 zukommen werden. Hier stellen wir den Industrial Data Space vor, der ein Fundament für Industrie 4.0 bildet, indem er sicheren und zertifizierten Datenaustausch zwischen Unternehmen ermöglicht, ohne dass die Eigentümer der Daten die Souveränität, d.h. die Kontrolle über ihre Daten verlieren. Er fördert damit die Nutzung und Verbreitung von Smart-Service-Konzepten.

Ausführliche Beschreibung
Referent
Stefan WeingärtnerDatatroniq
CEO
DATATRONIQ GmbH
12:35 Uhr
Mittagspause
13:45 Uhr
Sessions werden auf Englisch gehalten
EXPO+
Keynote

As data science captures more attention from decision makers, translating the models from the language of the analyst into a language of the decision maker has become an important topic at conferences and in journals. It used to be that the focus on data storytelling was on visualization techniques. While this is important, as analyses become more complex, the task of interpreting the models likewise becomes more complex. Before we can decide on visualization techniques, we first need to uncover what to visualize. In this keynote, Mr. Abbott will describe ways to unravel complex descriptive and predictive models so they can be explained and visualized using machine learning models and resampling techniques. 

Ausführliche Beschreibung
Referent
Dean AbbottSmarterHQ
Co-Founder and Chief Data Scientist
SmarterHQ
14:45 Uhr
Raumwechsel für Kombi-Pass-Teilnehmer
14:50 Uhr
Sessions werden auf Deutsch gehalten
Track 1

Die fachlich- technische Verknüpfung von Aspekten der klassischen BI und moderner Data Science – alles möglichst unter einem Dach – stellt viele Unternehmen teilweise vor große Herausforderungen.

Wie bringt man Enterprise-Architektur, Governance und Stabilität einerseits mit Agilität, Data Science und Big Data-Fähigkeit andererseit unter einen Hut?

"Will it blend?" ist dabei die Frage, die sich viele Unternehmenslenker heute stellen und für die in den Dimensionen Technologie, Tools, Prozesse, Skills, Organisation und Unternehmenskultur Antworten erarbeitet werden sollten.

Im Rahmen der Präsentation beleuchtet Herr Nolte anhand seiner praktischen Erfahrungen die wichtigen Erfolgsfaktoren dieses Changeprozesses.

Ausführliche Beschreibung
Referent
Dr. Matthias NolteBerliner Sparkasse
Head of BI Servies
Berliner Sparkasse
Sessions werden auf Deutsch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)

Viele Firmen haben in den letzten Jahren umfangreiche Data Lakes erstellt, in der Hoffnung, mit den daraus gewonnenen Erkenntnissen Geschäftsentscheidungen zu verbessern und zu beschleunigen. Doch es macht sich mittlerweile auch erhebliche Frustration breit, weil sich die Extraktion nützlicher Informationen aus großen Datenmengen doch erheblicher schwieriger gestaltet als ursprünglich angenommen. Dieses Tutorial stellt einige generell anwendbare Methoden und Algorithmen vor, mit den sich Anomalien und Auffälligkeiten aus großen Datenmengen extrahieren lassen. Hierzu gehören beispielsweise: Zeitreihenanalyse, Mustererkennung, Ursachenanalyse und Gruppenbildung. Auch wird ein Verfahren gezeigt, wie maschinelles Lernen zum Einsatz kommen kann, auch wenn keine sog. Labels zur Verfügung stehen, was in der Praxis oftmals der Fall ist.

Ausführliche Beschreibung
Referent
Norbert KraftNokia Bell Labs
Referent Research & Technology
Nokia Bell Labs
Sessions werden auf Englisch gehalten
Track 3 - Deep Dive Expert Session (maximal 30 Personen, First Come First Serve!)

This session focuses on a new hype wave in neural network modeling called Deep Learning or Deep Neural Networks. Dr. Ralph Grothmann will look behind the scenes and explain the differences between “standard” feedforward and deep neural network models. The decay in gradient information over long chains of hidden layers can be avoided by e.g. multiple outputs, information highways or short cuts, as well as stochastic learning rules. Auto-associators and convolutions enable us to model high-dimensional input spaces by the automated generation of features. Besides deep feedfoward neural networks we will also deal with time-delay recurrent neural network architectures, where deepness is a natural feature when non-algorithmic learning techniques like error backpropagation through time are used. Dr. Ralph Grothmann will give examples of the application of deep neural networks form recent project work and show the merits of the “new” approach in comparison to non-deep modeling techniques. Among others you will deal with the modeling of e.g. the energy supply from renewable sources, energy load forecasting as well as the identification of features responsible for component failures and soft sensor modeling.

Ausführliche Beschreibung
Referent
Dr. Ralph GrothmannSiemens
Principal Consultant
Siemens AG, Corporate Technology
15:35 Uhr
Kaffeepause
16:00 Uhr
Sessions werden auf Deutsch gehalten
Track 1
Teil 1

Ab 2018 wird die europäische Datenschutzgrundverordnung (General Data Protection Regulation – GDPR) in nationales Recht umgesetzt. Damit geht ein langer politischer Prozess in einer Zeit zu Ende, in der sich die digitale Welt schon zweimal um sich selbst gedreht hat. Welche Auswirkungen haben die neuen Regelungen auf die Unternehmen? Welche juristischen Änderungen sind wichtig und welche Antworten bietet die GDPR heute auf die technischen Fragen von morgen wie künstliche Intelligenz und Predictive Analytics?

Ausführliche Beschreibung
Referent
Björn Stecherinitiative d21
stellvertretender Geschäftsführer
Initiative D21 e.V.
Teil 2

Die neue DSGVO (Datenschutzgrundverordnung / Englisch GDPR), die am 25. Mai 2018 für die gesamte EU in Kraft tritt, ist das weitestreichende Gesetz zum Schutz persönlicher Daten. Es birgt einige neue Anforderungen an Data Scientists im Umgang mit persönlichen Daten – sowohl im B2C als auch im B2B-Umfeld. Dieser Vortrag befasst sich aus praktischer Sicht mit fünf Kernthemen, die für das Predictive Modeling relevant sind: Informationspflicht, Erlaubnis für die Datennutzung, Recht auf Vergessenwerden, Diskriminierung und Pseudodiskriminierung sowie Anonymisierung von Daten. Der Vortrag stellt konkrete Beispiele zur Lösung dieser Herausforderungen vor, die auf Open Source Software basieren und die Sie im Anschluss selbst ausprobieren können.

Ausführliche Beschreibung
Referent
Phil WintersCIAgenda
Senior Managing Partner
CIAgenda
Sessions werden auf Englisch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)

R is a standard tool for predictive modeling. It allows to use hundreds of predictive models and build complex workflows. The presentation is a guided tour through the most important R packages. It is illustrated with working R examples. You will learn how to:

– use R for predictive modeling including feature selection, model building, validation, and deployment

– work with universal and powerful packages `caret` and `mlr`

– a couple of specialized packages like `xgboost` and `caretEnsemble`

– supporting packages like `PMML`

– as a help we will use H2O and Spark

– and others

Ausführliche Beschreibung
Referent
Dr. Artur SuchwalkoQuantUp
Data Scientist, Owner
QuantUp
17:00 Uhr
Raumwechsel für Kombi-Pass-Teilnehmer
17:05 Uhr
Sessions werden auf Englisch gehalten
Keynote

The “Big Data” and “Data Science” rhetoric of recent years seems to focus mostly on collecting, storing and analysing existing data. Data which many seem to think they have “too much of” already. However, the greatest discoveries in both science and business rarely come from analysing things that are already there. True innovation starts with asking Big Questions. Only then does it become apparent which data is needed to find the answers we seek.
In this session, we relive the true story of an epic voyage in search of data. A quest for knowledge that will take us around the globe and into the solar system. Along the way, we attempt to transmute lead into gold, use machine learning to optimise email marketing campaigns, experiment with sauerkraut, investigate a novel “Data Scientific” method for sentiment analysis, and discover a new continent.
This ancient adventure brings new perspectives on the Big Data and Data Science challenges we face today. Come and see how learning from the past can help you solve the problems of the future.

Ausführliche Beschreibung
Referent
Lukas VermeerBooking.com
Data Scientist
Booking.com
18:05 Uhr
Ende des ersten Konferenztages
18:30 Uhr
Abfahrt der Shuttlebusse
19:00 Uhr

Abendveranstaltung:

DDB Networking Lounge

Predictive Analytics World for Business - Berlin - Tag 2 - Dienstag, 14. November 2017

08:00 Uhr
Registrierung und Frühstückssnacks
09:15 Uhr
Sessions werden auf Deutsch gehalten
Keynote
Die Keynote Beschreibung folgt in Kürze.
Ausführliche Beschreibung
09:55 Uhr
Sessions werden auf Deutsch gehalten
Sponsored Session
Die Session Beschreibung folgt in Kürze.
Ausführliche Beschreibung
10:00 Uhr
Raumwechsel für Kombi-Pass-Teilnehmer
10:05 Uhr
Sessions werden auf Englisch gehalten
Track 1
Teil 1

Being able to predict customer demand for a particular product and have that product available for sale when required is a fundamental get right for any supply chain. But what if everything we try doesn’t work, and in many cases appears to make the forecast work? Alex gives an account from Shell’s Lubricants Supply Chain on the journey taken by the newly formed Central Forecasting Team in an effort to turn-around and improve a failing metric (Forecast Accuracy) that was being blamed for a wide range of organisational pain. Alex touches on the various ideas that didn’t work (from flat targets, to simply manipulating the data) and the affect these had, before moving on to the later ideas, and career risk, that began to move the needle in the right direction. Key take always include plenty of things to avoid, some useful tools such as segmentation, and the simple question to ask when nothing else works.

Ausführliche Beschreibung
Referent
Alex HancockShell Oil Company
Head of Treasury Analytics
Shell Oil Company
Teil 2

Political bombshells, unimaginable terrorist attacks, epidemic outbreaks, natural disasters, technological disruptions, fractured markets, transitory advantages, multifarious competitors, increasingly demanding customers and fickle consumers. Thanks to the military, we have a useful descriptor for the conditions and environment these drivers create; ‘VUCA’ – Volatility, Uncertainty, Complexity and Ambiguity… a combination of the magnitude and speed of change, the lack of predictability and prospect of surprise, the multitude of forces and confounding issues, and the lack of ‘one right answer’ or single course of action. Yet against this backdrop many organisations are still carrying the early, often ill-formed, baggage of implicit promises and expectations of Big Data and Analytics, and the mindset of operating in more stable conditions. And that’s before we get to sentiment mining, machine learning, edge analytics and the like. There is no question about the power, pervasiveness, further potential and applicability of predictive analytics. But it is at the edge of this applicability that things get interesting; where a VUCA environment lays cognitive traps for those focused on ‘getting to the right answer’ rather than ‘asking the right questions’. In the context of strategy development, deployment and delivery in the real world, this edge – between prediction and insight, between extrapolation and choice, between algorithm and decision – is critical. This session explores some of the typical problems and hidden traps in creating strategy against a VUCA backdrop, considers the tensions that exist across our unavoidably uneven knowledge of the world, offers some mental models to help leaders grapple with this wicked problem, and to help you drive the most impact and value in support of your strategy.

Ausführliche Beschreibung
Referent
Chris TurnerStrataBridge
Co-Founder
StrataBridge
Sessions werden auf Deutsch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)

Beschreibung: Machine Learning ist im Online Marketing allgegenwärtig. Der Fokus liegt jedoch meist auf der Optimierung der Auslieferung und weniger der Gestaltung von Ads. Die Auswahl von Text und Bild erfolgt oftmals nach Bauchgefühl und persönlicher Erfahrung. In dem Vortrag zeigen wir, wie plista Machine Learning verwendet, um Werbetreibende bereits in der “kreativen Phase” mit Empfehlungen bezüglich der Text- und Bildgestaltung zu unterstützen. Welchen Einfluss hat ein Wort auf die Klickrate? Was sind bessere Formulierungen? Welche Objekte im Bild erregen die Aufmerksamkeit? Wir behandeln Feature Engineering Methoden für NLP (u.a. Entity Recognition), diskutieren die Modellwahl und teilen unsere Erfahrungen bezüglich der schlanken Entwicklung eines Data Products. Im Bereich der Bilderkennung präsentieren wir zudem unseren Deep Learning Ansatz einer neu trainierten Inception-v3 Architektur.

Ausführliche Beschreibung
Referent
Malte GanßaugePlista
Data Scientist
plista GmbH
Sessions werden auf Deutsch gehalten
Track 3 - Deep Dives Expert Session (maximal 30 Personen, First Come First Serve!)

Uplift Modelling wird oft als der Heilige Gral des Marketings beschrieben. Die Anwendung dieser Technik soll den Marketer in die Lage versetzen, nur die Kunden zu bewerben, bei denen dieser Anstoß auch zu einer Reaktion führt. So spart man sich das Aufwecken "schlafender Hunde" im Falle von Vertragskündigungen und schreckt keine potentiellen Kunden ab, die nach dem x-ten Newsletter genervt abwinken.

In der Praxis wird Uplift Modelling bis jetzt selten angewandt, da das Feld komplex und fehlerträchtig ist.

Die Deep-Dive-Session "Uplift-Modelling Hands-on" zeigt praxisnah, wie Uplift-Modelle funktionieren, wie man diese auf eigenen Daten erstellt und welche Fallstricke man beachten muss.

Ausführliche Beschreibung
Referent
Dr. Dennis ProppeGpredictive
CTO
Gpredictive GmbH
11:05 Uhr
Kaffeepause
11:30 Uhr
Sessions werden auf Deutsch gehalten
Track 1
Teil 1

Die Swiss Re als Rückversicherer operiert – auch im Bereich Predictive Analytics – als B2B-Geschäftspartner für Erstversicherer. Eines der Angebote von Swiss Re ist die Global Motor Risk Map. Dieser Service erstellt Vorhersagen für Unfallrisiken mit hoher geografischer Granularität basierend auf externen Daten wie Bevölkerungsdichte oder der Struktur des Straßennetzwerks. Dies ermöglicht dem Erstversicherer als Kunde seine Geschäftstätigkeit aufgrund konkreter Vorhersagen zu den Auswirkungen von geplanten Maßnahmen zu steuern. Der Vortrag fokussiert auf "Lessons Learned" aus der Entwicklung des Produkts in den Bereichen: Aufbereitung der externen Daten, Validierung der Vorhersagen sowie Einbettung in die kundenseitige Prozesslandschaft inklusive automatischer Aufdatierung der Vorhersagen.

Ausführliche Beschreibung
Referent
Dr. Christian ElsasserSwiss Re
Manager Data Analytics
Swiss Reinsurance Company Ltd
Teil 2

Die herkömmlichen quantitativen Finanzanalysen unterliegen hinsichtlich Ausfallfrüherkennung mitunter eheblichen Zeitverzögerungen. Aus diesem Grund kommt qualitativen Faktoren und hierbei insbesondere öffentlich verfügbaren Krisensignalwerten eine erhebliche Bedeutung im Credit Risk Management zu. Keyword-Alerting ist hierbei jedoch heute noch viel zu oft statisch. Begriffslisten werden manuell im Web gesucht und liefern unzureichende Ergebnisse. Hohe False-Positive-Ratios beanspruchen erhebliche Ressourcen im Credit Risk Management. Daneben mangelt es der statischen Listenabfrage an Flexibilität hinsichtlich zielgerichteter Erfassung der Kreditrisiken. Gemeinsam mit Concardis hat DATAlovers eine Lösung entwickelt, bei der ausgehend von einer Ereignishistorie und von Schlüsselwörtern die relevanten Konstellationen und umgebenen Inhaltsfragmente über maschinelles Lernen identifiziert werden. Fortan werden diese Muster ebenso als Grundlage für ein Alerting herangezogen. Gleichzeitig lernt der Alerting-Mechanismus aus den Fehlalarmen und schärft die Güte des Alerts. Ziel aus Sicht von Concardis: den manuellen Arbeitsaufwand reduzieren und intelligent über mögliche Veränderungen informiert zu sein.

Ausführliche Beschreibung
Referenten
Andreas KulpaDATAlovers
COO
DataLovers AG
Jan Marcinkowskiconcardis
High Risk Merchant Underwriting & Credit Risk Management
Concardis
Sessions werden auf Deutsch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)
Die Session Beschreibung folgt in Kürze.
Ausführliche Beschreibung
Sessions werden auf Englisch gehalten
Track 3 - Deep Dive Expert Session (maximal 30 Personen, First Come First Serve!)

Together with our client 220-volt.ru, one of the largest Russian DIY online-stores, we tried to understand customer behaviour and to find an algorithm to re-distribute marketing budget according to the input of each channel. To do this, we took historical user data and calculated the probability of purchase. In this deep dive / case-study we will show how we used machine learning to increase the overall e-commerce spendings up to 20%. The revenue per customer also increased significantly: twice in comparison to control group. At the beginning, we have tested different machine learning models: logistic regression, random forest, XGBoost. We checked it out then with AUC ROC metric and used holdout and cross-validation. To make sure our predictions are working we applied finally an A/B test. In our workshop-like session we will provide all tools and query samples in a step-by-step guide, so that everyone can try to play with their own raw data using free and open source tools: Yandex.Metrica Logs API, ClickHouse open-source DBMS, Python, Pandas, XGBoost. This session enables you to implement your own predictive customer journey.

Ausführliche Beschreibung
Referent
Viktor TarnavskyYandex
Head of Yandex.Metrica
Yandex N.V.
12:30 Uhr
Mittagspause
14:00 Uhr
Sessions werden auf Deutsch gehalten
Track 1
Teil 1

Der Einsatz von Predictive Analytics (PA) in amerikanischen Präsidentschaftswahlkämpfen seit 2008 verdeutlicht den Nutzen, den PA für politische Kampagnen haben kann. Längst ist das Thema auch bei deutschen Parteien angekommen. So optimiert die SPD mit dem Einsatz von Business Intelligence (BI) und PA anstehende Wahlkämpfe und begegnet dabei Herausforderungen, die sich in Deutschland gegenüber den USA ergeben: heterogenere Datenquellen, kleinere Datenmengen, strikterer Datenschutz und kleinere Budgets. Wir stellen den Aufbau und die Funktionsweise der Analysearchitektur der SPD exemplarisch anhand von Wahlprognosen auf Wahlkreisebene dar. Dabei diskutieren wir auch eingesetzte Verfahren des maschinellen Lernens, die Evaluation der Vorhersage sowie das finale Reporting. Der Vortrag bietet damit einen umfassenden Einblick in die Entwicklung von PA und BI im Kontext heterogener Daten und begrenzter Ressourcen.

Ausführliche Beschreibung
Referenten
Marco Nälitzareto consulting
Data Scientist
areto consulting gmbh
Dr. Matthias OrlowskiSPD
Parteivorstand
SPD
Teil 2

„Bekommt Rot-Rot-Grün eine Mehrheit im Bundestag?“, „Bleibt Angela Merkel Bundeskanzlerin?“ oder „Wird die AfD die drittstärkste Partei?“. Diese und weitere Fragen tauch(t)en im Vorfeld der Bundestagswahl 2017 auf. Konventionelle Wahlprognosen der Wahlforschungsinstitute liefern jedoch keine Antwort darauf mit welcher Wahrscheinlichkeit solche Ereignisse eintreffen werden, sondern nur eine Stimmanteil-Prognose für die Sonntagsfrage, eine imaginäre Bundestagswahl am nächsten Sonntag.
Wir nutzen die verfügbaren Wahlprognosen und historische Daten um mithilfe von Predictive Analytics konkrete Wahrscheinlichkeitsaussagen über oben aufgeführte Fragen zu treffen. Nate Silver, Buchautor und Statistiker, hat es für die US-Präsidentschaftswahlen in seinem Blog „FiveThirtyEight“ vorgemacht. Seit März 2017 bietet INWT Statistics eine methodisch vergleichbare und wöchentlich aktualisierte Wahlprognose für die Bundestagswahlen an. Neben der Vorstellung der Prognose und der zugrundeliegenden Methodik, wird die Gelegenheit genutzt unsere Prognosen rückblickend zu evaluieren.

Ausführliche Beschreibung
Referent
Dr. Marcus GroßINWT Statistics
Senior Data Analyst
INWT Statistics
Sessions werden auf Deutsch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)
Die Session Beschreibung folgt in Kürze.
Ausführliche Beschreibung
15:00 Uhr
Kaffeepause
15:30 Uhr
Sessions werden auf Englisch gehalten
Track 1
Teil 1

Network switch resembles in many ways to traffic signs in a junction, telling the vehicles where to turn to in order to reach a specific destination. Open virtual switch (OVS) is a piece of software that emulates a network switch. It is powerful in that it enables software defined networking (SDN) applications - much more dynamic and flexible compared to traditional networking. However, as a software-based solution, the OVS performance is sensitive to the memory cache optimization in the compute host it is utilizing. In this talk Aviv Gruber will show via an illustrative example of cloud networking how a feature engineering of new scores improves the network performance of the OVS, in particular latency reduction of up to 23% and throughput improvement of up to 33%.

Ausführliche Beschreibung
Referent
Dr. Aviv GruberHuawei
Data Scientist
Huawei Technologies Co.
Teil 2

This presentation will give an insight into how we helped one of the largest logistics company in the Middle East to automate the delivery of their shipments using machine learning. The problem was particularly interesting because there are no postcodes in the region. Instead our client would have to make a phone call to each customer and get a description of the address instead, e.g. house with brown door around XYZ roundabout. This process became more difficult because of the cultural dynamics existing amongst the demographics.
This presentation will describe how we leveraged the GPS data the client had to predict the delivery location using clustering and classification algorithms and how we operationalised the model in order to drive actions in real time.

Ausführliche Beschreibung
Referent
Megha AgarwalPivotal
Data Scientist
Pivotal
Sessions werden auf Deutsch gehalten
Track 2 - Deep Dive Beginners Session (maximal 30 Personen, First Come First Serve!)
Die Session Beschreibung folgt in Kürze.
Ausführliche Beschreibung
16:30 Uhr
Raumwechsel für Kombi-Pass-Teilnehmer
16:35 Uhr
Sessions werden auf Deutsch gehalten
EXPO+
Abschluß-Keynote

Seit Mitte 2014 hat David fast 100.000 Artikel von Spiegel-Online systematisch gespeichert. Diese Datenmasse wird er in einem bunten Vortrag vorstellen und erforschen.
Der Vortrag gibt tiefe und überraschende Einblicke in das Verhalten des vielleicht größten Meinungsmachers Deutschlands. Dazu gibt er einen allgemeinverständlichen, bunten und unterhaltsamen Überblick über die verschiedenen Aspekte der Data Science.

Ausführliche Beschreibung
Referent
David KrieselProcter & Gamble
Advanced Analytics Technology Engineer
Procter & Gamble Manufacturing GmbH
17:15 Uhr
Ende der Predictive Analytics World Berlin 2017
SchließenGewählte Tags: