Clustering-based behavioural analysis of biological objects
2011
Kirshners, A., Riga Technical Univ. (Latvia). Inst. of Information Technology
English. The article examines the problem of processing short time series for bioinformatics tasks using data mining methods in the field of pharmacology. The experiments were conducted using heart contraction (contraction and relaxation) power data that were obtained in experiments with laboratory animals with the goal of registering the power changes of heart contractions in different stages of experiment in a given period of time. The selected data were treated using data preprocessing technologies. The short time series were compared using various time-point similarity search methods using agglomerative hierarchical clustering, k-means clustering, modified k-means clustering and expectation-maximization clustering algorithms. Based on the clustering result evaluation the most suitable algorithm was chosen and the optimal number of clusters was determined for the least clustering error. The acquired clusters were used for to create cluster prototypes that aggregate the groups of similar heart contraction power objects. The article offers an examination of the errors produced by algorithms and methods as well as a discussion of the obtained clustering results using different evaluation methodologies. It also gives conclusions about the application of data mining methods in solving bioinformatics tasks and outlines further research directions.
Show more [+] Less [-]Latvian. Darbā tika aplūkota problēma, kas saistīta ar īsu laika rindu apstrādi, risinot bioinformātikas uzdevumu farmakoloģijas nozarē, pielietojot datu ieguves metodes. Eksperimentiem tika izmantoti dati par sirds kontrakcijas (saraušanās un atslābšanas) spēku, kas iegūti eksperimentos ar laboratorijas dzīvniekiem, ar mērķi reģistrēt sirds kontrakcijas spēka izmaiņas dažādās eksperimenta stadijās noteiktā laika periodā. Atlasītie dati tika apstrādāti, izmantojot datu pirmapstrādes tehnoloģijas. Īsu laika rindu salīdzināšanai tika izmantotas dažādas punktveida līdzības meklēšanas metodes, izmantojot aglomeratīvo hierarhisko, k-vidējo, modificētu k-vidējo un maksimālās līdzības (EM) algoritmus. Balstoties uz klasterizācijas rezultātu novērtējumu, tika izvēlēts atbilstošākais algoritms un noteikts piemērotākais klasteru skaits, kas nepieciešams šīs datu kopas klasterizācijai, balstoties uz klasterizācijas vidējās absolūtās kļūdas novērtējumu. Pamatojoties uz iegūtajiem klasteriem, tika izveidoti paraugmodeļi klasteros, kuri apvieno līdzīgu sirds kontrakcijas spēka objektu grupas. Darbā tika izvērtētas pielietoto algoritmu un metožu radītās kļūdas. Salīdzināti iegūtie klasterizācijas rezultāti, pielietojot dažādu novērtēšanas metodiku. Izdarīti secinājumi par datu ieguves metožu pielietošanu bioinformātikas uzdevumu risināšanai, iezīmētas nākotnes vīzijas turpmākajiem pētījumiem.
Show more [+] Less [-]AGROVOC Keywords
Bibliographic information
This bibliographic record has been provided by Fundamental Library of Latvia University of Life Sciences and Technologies