Introduction
"TextMining(Englishversion)"isamasterpieceinthefieldoftextmining.Theauthorisaworld-renownedauthoritativescholar."TextMining(EnglishEdition)"isverysuitableforresearchersandpractitionersinthefieldoftextminingandinformationretrieval.Itisalsosuitableasatextbookfordataminingandknowledgediscoverycoursesforpostgraduatesincomputerandrelatedmajorsincollegesanduniversities.
Abouttheauthor
RonenFeIdmarl,apioneerinmachinelearning,dataminingandunstructureddatamanagement.SeniorLecturerintheDepartmentofMathematicsandComputerScienceatBar-liarlUniversity,Israel,DirectoroftheDataMiningLaboratory,Co-founderandChairmanofClearforestCompany(mainlydevelopingnext-generationtextminingapplicationsforenterprisesandgovernmentagencies),andnowamemberofNewYorkUniversity'sSternSchoolofBusinessAssociateProfessor.
JamesSangerventurecapitalist,arecognizedindustryexpertinthefieldsofbusinessdatasolutions,InternetapplicationsandITsecurityproducts.Heco-foundedABSVetlluresin1982.Priortothis,hewasthemanagingdirectorofDBCapitalNewYork.HegraduatedfromtheUniversityofPennsylvaniawithabachelor'sdegreeandgraduatedfromtheUniversityofOxfordandtheUniversityofLiverpool.HeisamemberofIEEEandtheAmericanAssociationforArtificialIntelligence(AAAI).
MediaRecommendation
"...Ostin tämän kirjan.Tämä kirja on ehdottomasti viitekirja, jota kannattaa hankkia."
——L.VenkataSubramaniam,IBMIndiaResearchLaboratory
"Anintroductiontotextminingwrittenbythemostimportantexpertinthefield.Thisbookisverywellwritten.Itperfectlycombinesthetheoryandpracticeoftextmining.Suitableforresearchersandpractitioners...Itishighlyrecommendedforthosewhodonothaveanycomputationallinguisticsbackgroundandwanttodelveintothefieldoftextminingtoreadthisbook."
——RadaMihalcea, Pohjois-Texasin yliopisto
Textmininghasbecomeanexcitingnewresearchfield.Thisbookiswrittenbyworld-renownedauthoritativescholars.Inadditiontoexplainingcoretextminingandlinkdetectionalgorithmsandtechniques,italsointroducesadvancedpreprocessingtechniques.Andconsiderthefactorsofknowledgerepresentationandvisualizationmethods.also.Thebookalsodiscussestheapplicationofrelatedtechnologiesinpractice,takingintoaccountthetheoryandpracticeoftextmining.
Sisältö
I. Johdanto TextMiningiin1
I.1Tekstilouhinnan määrittäminen1
I.2TextMiningSystemsin yleinen arkkitehtuuri13
II.CoreTextMiningOperations19
II.1CoreTextMiningOperations19
II.2BackgroundKnowledgen käyttäminen tekstinlouhintaan41
II.3TextMiningQueryLanguages51
III.TextMiningPreprocessingTechniques57
III.1Tehtävälähtöiset lähestymistavat58
III.2Lisätietoja62
IV. Luokittelu64
IV.1Tekstiluokituksen sovellukset65
IV.2Ongelman määritelmä66
IV.3Asiakirjan esittäminen68
IV.4Tietotekniikan lähestymistapa TC70:een
IV.5Koneoppimisen lähestymistapaTC70:een
IV.6UnlabeledDatatoImproveClassificationin käyttäminen78
IV.7Tekstiluokittajien arviointi79
p>IV.8Sitaatit ja huomautukset80
V.Clustering82
V.1ClusteringTasksinTextAnalysis82
V.2Yleinen klusterointiongelma84
V.3ClusteringAlgoritms85
V.4Tekstitietojen klusterointi88
V.5Sitaatit ja huomautukset92
VI. Tietojen purku94
VI.1InformationExtractionin esittely94
VI.2IE:n historiallinen kehitys:TheMessageUnnderstandingConferencesandTipster96
VI.3IEEsimerkkejä101
VI.4Järjestelmien arkkitehtuuri104
VI.5AnaphoraResolution109
VI.6Induktiiviset algoritmit IE119:lle
VI.7RakenneIE122
VI.8Lisätietoja129
VII.ProbabilisticModelsforInformation Extraction131
VII.1PiilotetutMarkov-mallit131
VII.2StochasticContext-FreeKielioppi137
VII.3Maksimaalisen entropian mallinnus138
VII.4Maksimaalinen entropiaMarkovmallit140
VII.5Ehdolliset satunnaiskentät142
VII.6Lisätietoja145
VIII.PreprocessingApplicationsUsingProbabilisticandHybridApproaches146
VIII.1HMM-Textual Analysis -sovellukset146
p>VIII.2MEMM:n käyttäminen tietojen purkamiseen152
VIII.3Tekstianalyysin CRF:n sovellukset153
VIII.4TEG:SCFGRulesfor HybridStatistical-Knowledge-BasedIE155:n käyttäminen
VIII.5Käynnistys166
VIII.6Lisätietoja175
IX.Selaamisen ja kyselyn tarkentamisen esitystaso huomioon ottaen177
IX.1 Selaaminen177
IX.2AccessingConstraintsandSimpleSpecificationFiltersatthePresentationLayer185
IX.3Pääsy alla olevaan kyselyyn186
IX.4Sitaatit ja huomautukset187
X.Visualization Approaches189
X.1Johdanto189
X.2Arkkitehtuurinäkökohdat192
X.3CommonVisualization Approachesfor Text Mining194
X.4LinkAnalysis-visualisointitekniikka225
X.5Real-WorldExample:TheDocumentExplorerSystem235
XI.LinkAnalysis244
XI.1Alkuvaiheet244
XI.2Verkkojen automaattinen asettelu246
XI.3PathsandCyclesinGraphs250
XI.4Keskipiste251
p>XI.5Verkkojen osiointi259
XI.6 Pattern MatchinginNetworks272
XI.7LinkAnalysis-ohjelmistopaketit273
XI.8Sitaatit ja huomautukset274
XII.TextMiningApplications275
p>XII.1Yleiset huomiot276
XII.2Yritysrahoitus: Kaivosteollisuuden kirjallisuus liiketiedustelulle281
XII.3A"Horisontaalinen"TextMiningApplication:PatentAnalysisSolutionLefagingaCommercialTextAnalytics Platform297
XII.4LifeSciencesResearch:MiningBiologicalPathwayInformation withGeneWays309
LiiteA:DIAL:ADedicatedInformationExtractionLanguageforTextMining317
A.1Mikä onDIALLkieli?317
A.2Tietojen purkaminen DIAL-ympäristössä318
A.3TextTokenization320
A.4ConceptandRuleStructure320
A.5PatternMatching322
A.6Pattern Elements323
A.7RuleConstraints327
A.8ConceptGuards328
A.9CompleteDIALesimerkkejä329
Bibliografia337
Hakemisto391