Biodiversitätsinformatik / Biodiversity Informatics |
Mathematisch-abstrakte Darstellung des Informationsflusses innerhalb eines "potential Taxon"-GraphsINHALT: Die Ausgangssituation | Formale Beschreibung der zugrundeliegenden Struktur | Lösungsansatz | Bedingungen Die AusgangssituationIn der Biologie bezeichnet man als Taxon (pl. Taxa) eine Gruppe von Organismen, die auf Grund ihrer gemeinsamen Abstammung bzw. ihrer Ähnlichkeit (nach verschiedenen Kriterien) zusammengefasst werden. Eine Vielzahl von Sachdaten, die sich in unabhängigen über die Welt zerstreute Quellen (Literatur, Datenbanken, usw.) befinden, sind an Taxonnamen gekoppelt und können über diese verknüpft werden. Erhebliche Schwierigkeiten dieses Wissen zusammenzuführen entstehen dadurch, dass oft in den verschiedenen Quellen unterschiedliche Auffassungen über die geltende Systematik/Klassifikation (d. h. auch über den zu benutzenden Taxonname, da dieser nach festgelegten Nomenklaturregeln diese Klassifikation miteinbeziehen muss) und/oder über die Umschreibungen einzelner Taxa (d. h. die implizite Liste der zu einem Taxon gehörenden Organismen) vertreten werden. Die Frage nach der Übertragbarkeit von Sachdaten, die an einem Taxonnamen aus einer Quelle gekoppelt sind, zu Taxonnamen aus einer anderen Quelle ist Gegenstand des Forschungsprojekts „MoreTax“. Eine Auffassung über einen Taxon in einer besonderen Quelle kann formal durch die Kopplung des benutzten Taxonnamens mit dem Quellenhinweis bezeichnet werden. Eine solche Kopplung nennen wir „potential Taxon“. Ein spezieller im „MoreTax“ Projekt konzipierter Editor (der taxonomische Editor) hat die Funktion, einerseits diese „potential Taxa“ aus verschiedenen Quellen aufzunehmen und andererseits einem Experten(-team) zu ermöglichen, die nach seiner Meinung existierenden Mengenbeziehungen zwischen den diesen „potential Taxa“ nach der jeweiligen Auffassungen zugrunde liegenden Umschreibungen der Taxa festzuhalten. Formale Beschreibung der zugrundeliegenden StrukturWir definieren: M = {M1, ......, Mn}, wobei Mi Mengen sind, deren Elementesliste unbekannt ist.
P Ì M x M.
V = {V1, ......, V64}, wobei Vi 6-Tupel sind, deren Komponente nur die Werte 0 oder 1 bzw. „falsch“ oder „wahr“ annehmen können.
Eine Funktion f : P ® V.
Man kann diese Struktur als Graph darstellen, in dem man M als Knotenmenge und P als Gerichtetensenkenmenge interpretiert. V ist dann als Gewichtungen oder Bewertungen der Senken zu betrachten.
Zyklen können in dieser Art von Graph auftreten. Gesucht wird eine Funktion g : M x M ® V , die aus f , aus der Grapharchitektur und aus der - für V vorausgesetzten - Mengenlehre hergeleitet wird. g soll die gerichtete Mengenbeziehung zwischen zwei beliebigen „potential Taxa“ Mq und Mz ermitteln, die dadurch entsteht, dass man von Mq zu Mz entlang der Senken des Graphs „reist“ und dabei die mengentheoretischen Interpretationen der „befahrenen Strecken“ miteinander verknüpft. Lösungsansatz1. Schritt: Definiere eine Funktion h : V x V ® V so, dass (f (Mi, Mj) = Vij Ù f (Mj, Mk) = Vjk) Þ h (Vij, Vjk) = Vik, wobei Vik die Mengenbeziehung zwischen Mi und Mk ist, die aus der Mengenlehre und den Mengenbeziehungen Vij (zwischen Mi und Mj) und Vjk (zwischen Mj und Mk) hergeleitet wird. Wenn
also (M1, M2) Î
P
und (M2, M3) Î
P,
kann folgender Term 2. Schritt: Definiere einen Algorithmus, der für (Mq, Mz) Î M x M die Menge Wqz aller Wege zwischen Mq und Mz ermittelt. Dabei gilt: WqzÎ
Wqz
Û
(Wqz = (Mr1, ......, Mrf) Ù
Mr1 = Mq Ù
Mrf = Mz Ù Wir nennen W die Menge aller Wege im Graph. 3. Schritt: Definiere eine Funktion h’ : W ® V so, dass (W
= (M1, M2) Î
W ) Þ
h’
(W) = f (M1, M2)
und 4. Schritt: Definiere zunächst eine Ordnung O Ì V x V innerhalb V so, dass O(Vi,
Vj) Û
(k<6 Þ
(bik £
bjk)), Definiere dann eine Funktion h* : V x V ® V so, dass h*
(Vi, Vj) = Vk Û
(((bi6 = 0 Ù
bj6 = 1) Þ
(Vk = Vi)) Ù
Definiere dann auch eine Funktion h** : V x V ® V so, dass h**
(Vi, Vj) = Vk Û
(((bi6 ¹
bj6) Þ
(bk6 = 1)) Ù
((bi6 = bj6) Þ
(bk6 = bi6)) Ù
5. Schritt: Schließlich definiere die Funktion g : M x M ® V so: (Wqz
= {W1}) Þ
(g
(Mq, Mz) = h’
(W1)) und
oder so: (Wqz
= {W1}) Þ
(g
(Mq, Mz) = h’
(W1)) und
BedingungenFür die Konsistenz der Auswertungen müssen folgende Bedingungen gelten. Kommutativität:
Assoziativität:
Distributivität:
Zur Vervollständigung und Vereinfachung werden drei zusätzlichen Funktionen definiert: f’ : V ® V
f’’ : V ® V so, dass
g’ : V ® B
Marc Geoffroy, August 2001 __________________________________________________________________________
MoreTax
(Modellierung von regelbasierten Funktionalitäten) ist ein vom Projektleiter: Walter
Berendsohn |
Diese Seite wurde zuletzt am 21-02-2002 geändert
© Freie Universität
Berlin, Botanischer Garten und Botanisches Museum Berlin-Dahlem,
Seitenverantwortlicher / Page editor: M.
Geoffroy.
BGBM Impressum / Imprint