一、四类核心数据
1. 一分一段表(必须)
来源优先级:省教育考试院、官方招生考试平台、经核验的第三方数据。每个省、年份、科类单独记录,综合改革省份需明确口径;至少保留近三年,建议近五年。
字段:province、year、subject_type、score、cumulative_count、same_score_count
2. 院校专业录取数据(必须)
优先使用专业粒度;只能取得专业组数据时必须标明口径。应区分校区、中外合作、专项计划、地方专项及征集志愿,不能用院校最低位次代替具体专业位次。
字段:province、year、batch、school_code、school_name、major_group_code、major_code、major_name、subject_requirements、plan_count、admitted_count、min_score、min_rank、avg_score、avg_rank、max_score、max_rank
3. 当年招生计划与院校专业主数据(必须)
专业代码、校区、学费、选科要求、体检限制和计划人数必须以当年招生章程及考试院计划为准。历史数据不能代替当年招生计划。
字段:year、province、school_code、school_name、school_level、ownership、city、campus、major_group_code、major_code、major_name、degree、duration、tuition、plan_count、subject_requirements、physical_exam_limits、single_subject_limits、remarks
4. 专业、职业与培养数据(推荐)
培养目标、核心课程、就业方向、深造方向及职业资格需要注明来源和年份;薪资、就业率等时效信息不得包装成确定承诺。
字段:major_code、major_name、major_category、core_courses、ability_tags、career_cluster、typical_roles、target_industries、further_study、certificates、employment_notes、source、source_year
二、考生信息
- 生源省份、年份、科类或选科、总分与全省位次。
- 优势及薄弱学科、意向地区、院校层次和专业偏好。
- 费用、校区、特殊项目、体检及单科限制。
- 兴趣测评结果、工作场景偏好和升学意愿。
三、推荐计算口径
- 使用官方一分一段表将分数转换为位次。
- 先按选科、批次、体检、单科和费用等硬条件筛选。
- 对近三年最低位次加权,近期数据权重更高,同时评估波动。
- 历史位次适配分仅用于比较,不等同于录取概率。
- 完成专业测评后,再综合专业适配、地域和院校层次排序。
- 按山东“专业(专业类)+学校”规则生成并检查冲稳保梯度。
四、质量验收
- 不同校区、代码、合作项目不得错误合并。
- 专业更名、拆分和合并需要保留映射记录。
- 所有数据保留来源、发布日期、抓取日期和版本。
- 正式填报必须复核当年考试院计划及院校招生章程。