RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Using Genetic Programming to Obtain Implicit Diversity
Högskolan i Borås, Institutionen Handels- och IT-högskolan.ORCID-id: 0000-0003-0412-6199
Högskolan i Borås, Institutionen Handels- och IT-högskolan.
Högskolan i Borås, Institutionen Handels- och IT-högskolan.ORCID-id: 0000-0003-0274-9026
Högskolan i Borås, Institutionen Handels- och IT-högskolan.
2009 (Engelska)Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

When performing predictive data mining, the use of ensembles is known to increase prediction accuracy, compared to single models. To obtain this higher accuracy, ensembles should be built from base classifiers that are both accurate and diverse. The question of how to balance these two properties in order to maximize ensemble accuracy is, however, far from solved and many different techniques for obtaining ensemble diversity exist. One such technique is bagging, where implicit diversity is introduced by training base classifiers on different subsets of available data instances, thus resulting in less accurate, but diverse base classifiers. In this paper, genetic programming is used as an alternative method to obtain implicit diversity in ensembles by evolving accurate, but different base classifiers in the form of decision trees, thus exploiting the inherent inconsistency of genetic programming. The experiments show that the GP approach outperforms standard bagging of decision trees, obtaining significantly higher ensemble accuracy over 25 UCI datasets. This superior performance stems from base classifiers having both higher average accuracy and more diversity. Implicitly introducing diversity using GP thus works very well, since evolved base classifiers tend to be highly accurate and diverse.

Ort, förlag, år, upplaga, sidor
IEEE, 2009.
Nyckelord [en]
genetic programming, bagging, ensembles, diversity, Machine learning
Nationell ämneskategori
Data- och informationsvetenskap Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:hj:diva-45809Lokalt ID: 0;0;miljJAILISBN: 978-1-4244-2959-2 (tryckt)OAI: oai:DiVA.org:hj-45809DiVA, id: diva2:1348936
Konferens
2009 IEEE Congress on Evolutionary Computation (CEC 2009), Trondheim, Norge
Tillgänglig från: 2019-09-06 Skapad: 2019-09-06 Senast uppdaterad: 2019-09-06Bibliografiskt granskad

Open Access i DiVA

fulltext(158 kB)20 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 158 kBChecksumma SHA-512
0cbba20acd04f0e8eb1ed11071a2826e12e19c70d1685123c729f5194d48c5f4c008e516433497221b3dfc563e39b95f64fc14db8b4f3477489d3933f7062fba
Typ fulltextMimetyp application/pdf

Personposter BETA

Johansson, UlfSönströd, CeciliaLöfström, TuveKönig, Rikard

Sök vidare i DiVA

Av författaren/redaktören
Johansson, UlfSönströd, CeciliaLöfström, TuveKönig, Rikard
Data- och informationsvetenskapData- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 20 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

isbn
urn-nbn

Altmetricpoäng

isbn
urn-nbn
Totalt: 58 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf