Feeds:
Beiträge
Kommentare

Posts Tagged ‘Bioinformatik’

ResearchbloggingBastian sagt:

Jeder der die englische Sprache erlernt hat dürfte sich über die blöden unregelmässigen Verben geärgert haben die es einfach auswendig zu lernen galt. Bei regelmässigen Verben werden Simple Past und Past Participle einfach durch anhängen von -ed gebildet, wie die Reihe talk/talked/talked während die unregelmässigen Verben scheinbar keinen Regeln folgen (go/went).

Das dürfte zwar nicht die Motivation der Bioinformatiker gewesen sein die sich mit dem Aussterben dieser unregelmässigen Formen beschäftigt haben, aber vielleicht erfüllt es ja den einen oder anderen mit Genugtuung dass sie immer weniger werden, denn auch Sprache ist ja lebendig und folgt einer Art Evolution.

Übrigens gibt es noch einen kleinen Trost für alle die ungern auswendig lernen: Nur 3% aller englischen Verben sind unregelmässig. Der Haken bei der Sache: Die Top 10 der meistbenutzten Verben sind ausschliesslich unregelmässig.

Deshalb untersuchte das Team von Bioinformatikern einen Satz von 177 Verben zu verschiedenen Zeitpunkten. Sie schauten sich diese im Alt-Englischen – so um 800 n. Christus -, im Mittel-Englisch was so um die 1200 war (als Beispiel werden im Paper die Canterbury Tales angeführt) und als letzten Punkt die Gegenwart an.

Im Alt-Englischen waren all diese Verben noch unregelmässig, während im Mittel-Englischen schon nur noch 145 der betrachteten Verben ihre unregelmässige Form hatten. Und heute sind es nur noch 98.

Eine Theorie für das Aussterben der unregelmässigen Formen hängt mit der Häufigkeit der Verwendung der Worte ab. Je seltener die Verben benutzt werden desto schneller geraten die unregelmässigen Formen in Vergessenheit und werden durch Regelmässige ersetzt.
Und um dies zu überprüfen schauten sie sich die gut 18 Millionen Worte umfassende CELEX-Datenbank an und erhielten so die Nutzungsfrequenzen der Wörter die sie mit dem Aussterben der unregelmässigen Verben in Relation setzten und erhielten einen erstaunlich einfachen Zusammenhang:

Die Halbwertszeit von unregelmässigen Verben ist proportional zur Quadratwurzel der Nutzungsfrequenz. Oder um es in einem kleinen Beispiel einfacher auszudrücken: Ein Verb was 100mal weniger benutzt wird als ein Vergleichs-Verb wird 10mal so schnell zum regelmässigen Verb.

Und damit haben die Forscher dann auch Vermutungen angestellt über die Zukunft: Sollte der Trend zum Verfall so weiterlaufen wie bisher werden im Jahre 2500 nur noch 83 der 177 betrachteten Verben unregelmässig sein. Darüber hinaus haben sie auch eine Vorhersage gemacht welches der Verben als nächstes regelmässig werden wird: Vermutlich wird es wed/wed/wed sein, was mit nur 4,2 mal pro Million Verben benutzt wird. Es wird dann zu wed/wedded/wedded regelmässig gemacht.

Also liebe Englisch-Schüler, es wird noch etwas dauern bis ihr euch das Auswendiglernen sparen könnt.

Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang, Martin A. Nowak (2007). Quantifying the evolutionary dynamics of language Nature, 449 (7163), 713-716 DOI: 10.1038/nature06137

Read Full Post »

ResearchbloggingBastian sagt:

Die meisten Leute denken bei den Anfängen von HIV sicherlich an die Welle von Infektionen in den 80ern wo sich der Virus erstmals einer breiteren Masse von Menschen zeigte. Weniger bekannt ist es da schon, dass die älteste, nachgewiesene Infektion mit HIV von 1959 stammt.

Doch wie alt ist das HI-Virus denn nun wirklich? Dieser Frage ging ein Team von Forschern um Michael Worobey von der University of Arizona nach. Dafür untersuchten sie in Paraffin eingebettete Gewebeproben aus Kinshasa die zwischen 1958 und 1960 entnommen & fixiert worden waren. Und in einem Fall, einer Probe eines Lymphknotens aus dem Jahre 1960, wurden sie fündig und konnten die RNA von HIV-1 nachweisen.

An sich ist das nun nicht so spannend, denn immerhin stammt die älteste nachgewiesene Probe wie gesagt aus dem Jahre 1959. Doch das Team hat mit Hilfe der Bioinformatik einen Datensatz bestehend aus alten und aktuellen Sequenzen analysiert.

Die genauen Details spare ich mir an dieser Stelle mal, denn die Mathematik dahinter ist nicht ganz so trivial wie man meinen könnte und zumindest ich mag das hier nicht vereinfacht darstellen, aber prinzipiell arbeitet man mit dem Prinzip der Molecular Clock.
Für den Fall das man die Mutationsrate für den betrachteten Fall bestimmen kann ergibt sich nämlich eine Beziehung zwischen den Sequenzunterschieden im Erbgut und der verstrichenen Zeit. Ermittelt man nun die Unterschiede in den Sequenzen kann man daraus auf die Evolutionsdauer schliessen.

Und genau dies haben die Forscher getan, und dabei festgestellt, dass es das HI-Virus vermutlich schon seit Anfang des 20. Jahrhundertes existiert. Bleibt wohl nicht viel als dann bald mal den 100ten Geburtstag von HIV zu feiern.

Michael Worobey, Marlea Gemmel, Dirk E. Teuwen, Tamara Haselkorn, Kevin Kunstman, Michael Bunce, Jean-Jacques Muyembe, Jean-Marie M. Kabongo, Raphaël M. Kalengayi, Eric Van Marck, M. Thomas P. Gilbert, Steven M. Wolinsky (2008). Direct evidence of extensive diversity of HIV-1 in Kinshasa by 1960 Nature, 455 (7213), 661-664 DOI: 10.1038/nature07390

Read Full Post »

Woran Philipp & ich gerade arbeiten.

Linus sagt:
Und hier woran ich diesen Sommer (im weiteren Sinne) gearbeitet habe:

Mehr gibt es (vielleicht) davon zu lesen, wenn (falls) es peer-reviewed wurde…

Read Full Post »

Philipp und ich machen zur Zeit bei den Münsteraner Bioinformatikern ein kleines Sommerprojekt und im Zuge dessen wir beide auch gerade Python zu lernen. Was gar nicht so einfach ist, bislang haben wir uns hauptsächlich mit try & error über Wasser gehalten und uns dafür auch gar nicht so schlecht geschlagen, denn unsere Vorkenntnisse bestanden nur daraus in der Schule mal Pascal angeschnitten zu haben.

Doch auf Dauer bringt das wenig und um auch etwas schneller zum Ziel zu kommen haben wir nun neben dem Buch Learning Python auch noch eine andere nette Quelle aufgetan:

Das Pasteur-Institut hat extra für Biologen zwei Tutorials geschrieben. Zum einen gäbe es da die allgemeine Einführung für alle die noch gar keine Ahnung vom Programmieren haben. Und zum anderen den Python course in bio informatics.

Besonders nett für Biologen: Alle Beispiele kommen aus dem Umfeld und auch der Gebrauch der spezifischen Bio-Pythonbibliothek wird gut erklärt. Für alle Interessierten sicherlich eine gute Lektüre.

Read Full Post »