Feeds:
Beiträge
Kommentare

Posts Tagged ‘Internet’

ResearchbloggingBastian sagt:

Das Google so ziemlich alle Nutzerdaten und Suchanfragen speichert dürfte für die meisten Leser hier ja nichts neues sein. Was für viele Menschen ein bedrohliches Big Brother-Szenario ist ignorieren andere einfach. Doch das Google damit nicht nur vermeintlich passende Werbung an den Mann bringen kann beweisen sie in einem Paper das letzte Woche in Nature erschienen ist.

Die Rede ist von den Google Flu Trends die das Ausbrechen von Grippe-Wellen beobachten. Die Grippe wird von den Influenzaviren ausgelöst und führt auch in Deutschland noch jährlich zu einigen Todesfällen.

Zur Beobachtung von Ausbrüchen haben sich die Jungs und Mädels zusammengesetzt und sich mal die Daten des US Centers for Disease Control and Prevention (CDC) und der European Influenza Surveillance Scheme (EISS) besorgt. Diese Organisation bekommen ihre Daten zum Teil auch über die Rückmeldungen von Ärzten die Grippe-Fälle weitermelden müssen.

Dann werden die Fälle gesammelt und wöchentlich veröffentlicht. Durch dieses ganze Prozedere entsteht eine Zeitverzögerung von 1-2 Wochen. Und genau hier setzt Google an, denn zu Zeiten von Grippewellen könnte man ja damit rechnen das auch im Web verstärkt nach Schlagworten gesucht wird die mit der Krankheit zusammenhängen. Um entsprechende Schlagworte zu finden hat Google die Suchdaten der letzten 5 Jahre ausgewertet zusammen mit den an die CDC gemeldeten Arztbesuche im Zusammenhang mit Grippe.

Durch diesen Vergleich wurden dann ein Set aus Suchanfragen erstellt das den höchsten Zusammenhang mit den Grippe-Daten der CDC hatte. Durch die Anzahl von Suchanfragen aus diesem Set kann dann wieder zurückgerechnet werden wieviel Prozent der Arztbesuche im Zusammenhang mit Grippe-Erkrankungen erfolgten.

Und so hat man ein Modell was prinzipiell aus der Zusammensetzung der Suchanfragen den Grippe-Status der Bevölkerung ausweisen kann. Und das dies erstaunlich gut funktioniert zeigen die Daten die Google Anfang 2008 errechnet hat: Die Werte stimmen erstaunlich gut mit den Daten der CDC überein. In der Grafik sieht man in Schwarz die von Google vorhergesagten Daten und die von der CDC erstellten Daten.

Google FluTrends

Das wäre so weit ja schön und gut. Doch nicht wirklich nützlich. Aber wie man ebenfalls aus dem Graphen sieht hat Google einen entscheidenden Vorteil:
Es ist fast 2 Wochen schneller als die CDC weil die Daten der Suchanfragen viel unmittelbarer ausgewertet werden können als wenn der Arzt erst seine Daten an die CDC schicken muss die diese dann wöchentlich veröffentlicht.

Bislang lassen sich die Daten leider nur für die USA abrufen, bleibt abzuwarten ob Google den Dienst irgendwann ausweiten wird.

Jeremy Ginsberg, Matthew H. Mohebbi, Rajan S. Patel, Lynnette Brammer, Mark S. Smolinski, Larry Brilliant (2008). Detecting influenza epidemics using search engine query data Nature, 457 (7232), 1012-1014 DOI: 10.1038/nature07634

Read Full Post »

ResearchbloggingPhilipp sagt:
Darum gehts in diesem Review aus PLoS Computational Biology.
Die Autoren diskutieren über den momentanen Zustand der Online-Wissensverwaltung und wie man diesen ändern könnte. Sie kritisieren, dass digitale Bibliotheken im „eingefrorenen“ Zustand verharren, also nur lesbare Informationen, ohne Möglichkeit für den Benutzer, Infos hinzuzufügen oder zu ändern; desweiteren stellen sie diverse Werkzeuge vor, um Informationen und Veröffentlichungen persönlicher zu gestalten sowie handlicher zu organisieren.
Zu Beginn werden die momentanen digitalen Bibliotheken wie PubMed usw. mit ihren Vor- und Nachteilen vorgestellt. Danach werden Werkzeuge vorgestellt, mit dem sich „menschlicher“ gestalten lassen – wie z.B. Mendeley, über dass Basti hier ja schon geschrieben hatte. Zusätzlich werden noch weitere Systeme vorgestellt, wie CiteULike.org, das man am ehesten mit Seiten wie delicious.com vergleichen könnte, da es sich dabei um ein System handelt, in dem Nutzer interessante oder sonstwie relevante Veröffentlichungen abspeichern sowie miteinander verbinden können.

Diese und andere Werkzeuge bezeichnen die Autoren als „a promising start“, bevor sie die grundlegenden momentanen Probleme solcher Programme nennen. In ihren Augen liegen die Probleme vor allem auf menschlicher Seite; z.B. gibt es leicht Probleme beim Auseinanderhalten zweier Autoren mit gleichem Namen – so findet man bei PubMed, welches Autoren mit Nachname + erster Buchstabe des Vornamens abspeichert, allein 2008 genau 181 Artikel von „Wu, R.“.
Desweiteren gibt es natürlich Probleme beim Vertrauen der Nutzer zu den Anbietern: Kommerziell basierte Dienste wie z.B. Connotea.org (gehört zur Nature Gruppe) wollen natürlich durch ihre Dienste einen Profit generieren, fehlt dieser, so werden die Dienste schnell wieder eingestellt – die Mühe, die sich die Nutzer bis dahin gemacht haben, wäre dann verloren.

Der ganze Artikel ist auch wunderschön geschrieben – wer kann einer Veröffentlichung mit so herrlichen Sätzen wie „Rumors of the death of printed books and the death of the journal have (so far) been greatly exaggerated“ schon widersprechen? Oder der hier: „It has been frequently been observed that scientists lag behind other communities in their use of the Web to communicate research, and that this is ironic given that the Web was invented in a scientific laboratory for use primarily by scientists“ – und das sind beides nur Zitate aus dem abschließenden Absatz!

(Natürlich ist das Wissenschaftsweißbier und andere Wissenschaftsblogs ein Gegenbeispiel für den letzten Satz – eine Institution, die noch wenig Aufmerksamkeit vonseiten der Wissenschaftsgemeinschaft oder der Öffentlichkeit erfährt; was sich aber hoffentlich in den nächsten Jahren ändern wird!)

Duncan Hull, Steve R. Pettifer, Douglas B. Kell (2008). Defrosting the Digital Library: Bibliographic Tools for the Next Generation Web PLoS Computational Biology, 4 (10) DOI: 10.1371/journal.pcbi.1000204

Read Full Post »