1.数据集介绍:
名称:Pima?Indians?Diabetes?Data?Set
来源:国家糖尿病/消化/肾脏疾病研究所
特点:多变量
实例数量:
适用于:分类问题
变量:8个医学预测变量和一个目标变量
目标:基于数据集中包含的某些诊断测量来诊断性的预测患者是否患有糖尿病
该数据集最初来自国家糖尿病/消化/肾脏疾病研究所。数据集的目标是基于数据集中包含的某些诊断测量来诊断性的预测患者是否患有糖尿病。
从较大的数据库中选择这些实例有几个约束条件。尤其是,这里的所有患者都是Pima印第安至少21岁的女性。
数据集由多个医学预测变量和一个目标变量组成Out