
大学生电脑购买影响因素分析和机型选择推荐
大学生电脑购买影响因素分析和机型选择推荐
原创 周定霜 等 用数说 2025年12月4日 11:09 湖北
作者:周定霜、项祥涛、尹雨、毛宇希(武汉纺织大学,信管23级)
摘要
在数字化教育深入发展的背景下,电脑已成为大学生学习、科研与生活的核心载体,而电脑市场机型多元化、功能差异化与大学生预算有限、专业需求多样的矛盾,导致其购机时频繁面临配置不符、预算超支等 “选择困境”。本研究以大学生群体为对象,聚焦电脑购买影响因素分析与个性化机型推荐,构建了完整的 “需求洞察 - 产品量化 - 匹配推荐 - 结果评估” 体系。
研究首先通过抖音、小红书平台抓取 2261 条用户需求数据,经清洗去重后得到 1894 条有效数据;同时从中关村在线抓取 249 条笔记本电脑产品数据,通过合并去重、结构化转换、缺失值处理、文本特征量化等预处理流程,形成含 189 款机型的标准化产品库。基于此,运用自然语言处理、词频统计与熵权法,构建了涵盖性能需求、便携性、预算区间等 8 大维度的用户需求画像,明确预算区间(权重 0.2863)与性能需求(权重 0.2843)为核心诉求;通过数值化、归一化处理及熵权法分析,构建产品特征画像,识别内存与存储(权重 0.1986)、散热要求(权重 0.1898)、屏幕与显示(权重 0.1831)为产品核心区分维度。
为实现精准匹配,研究设计双权重融合机制:先通过 “整体用户画像(30%)+ 个人文本需求(70%)” 生成个性化用户权重,再结合 “个性化需求权重(70%)+ 产品熵权(30%)” 构建组合权重,对产品 8 大核心维度性能得分进行加权计算,生成 Top10 个性化推荐列表。推荐结果验证显示,核心维度(预算、性能)匹配度集中在 0.643-0.702 区间,平均分 0.670,中位数 0.659,契合用户实际诉求。
研究核心结论表明:大学生电脑购买决策呈现 “预算优先、性能刚需” 的优先级特征,双权重融合机制有效平衡了群体共性与个人差异、需求强度与产品特性,实现了需求与产品的精准量化对接;多维度量化与可视化技术提升了推荐系统的实用性与可解释性。
本研究的理论价值在于构建了大学生电脑消费决策分析框架,填补了细分群体研究空白;实践价值体现为:为大学生提供高效购机参考,帮助规避购买误区;为电脑厂商提供需求洞察,助力产品研发与精准营销;为高校提供新生设备购置建议,间接保障教学科研顺利开展。
第一章 绪论
一、研究背景与意义
(一)研究背景
在数字化浪潮席卷教育领域的当下,电脑已从过往的“辅助工具”转变为大学生学习、科研与生活的核心载体。无论是线上课程学习、专业软件操作(如编程、设计、数据分析),还是学术文献查阅、团队协作项目推进,都高度依赖高性能、适配性强的电脑设备。随着消费电子技术的快速迭代,电脑市场呈现出机型多元化、功能差异化、价格分层化的特征,笔记本、台式机、二合一设备等各类产品层出不穷,品牌竞争也日趋激烈。
与此同时,大学生群体作为电脑消费的核心受众之一,其消费需求具有显著的特殊性:一方面,他们受限于学业支出,预算普遍有限,对性价比有较高要求;另一方面,不同专业(如文科、工科、艺术类)对电脑性能、配置的需求差异较大,加之个人使用习惯、外观偏好、品牌认知等因素的影响,导致大学生在电脑购买过程中常面临“选择困境”,易出现配置不符、预算超支或性能浪费等问题。
(二)研究意义
1. 理论意义
本研究聚焦大学生这一特定消费群体,系统梳理电脑购买过程中的关键影响因素,构建多维度的消费决策分析框架,可丰富青年消费行为理论体系,为消费心理学、市场营销学等相关领域的研究提供新的实证参考。同时,研究结合专业差异与使用场景,探索“需求 - 配置 - 选择”的内在关联机制,填补了现有研究中针对大学生细分群体电脑购买行为研究的不足,为后续相关领域的深入研究奠定基础。
2. 实践意义
对大学生而言,研究结果可帮助其清晰认知自身核心需求,规避购买误区,精准匹配符合专业需求与预算的电脑机型,提升消费决策效率与满意度。对电脑厂商而言,研究能够揭示大学生群体的消费偏好与需求痛点,为产品研发、市场定位与营销策略制定提供数据支撑,助力厂商优化产品结构、精准对接市场需求。对高校而言,研究结论可作为校园信息化建设的参考依据,为新生入学设备购置提供合理建议,间接保障教学活动与学术研究的顺利开展。
二、研究目的
本研究以大学生群体为研究对象,旨在通过系统分析电脑购买影响因素,构建科学合理的机型选择推荐体系,具体实现以下目标:
(一)核心影响因素识别与作用机制解析
系统识别大学生电脑购买决策中的关键影响因素,涵盖价格预算、性能配置(处理器、内存、显卡、存储等核心硬件参数)、品牌口碑与售后服务、专业适配性、外观设计与便携性、续航能力及扩展功能等多维度内容,通过量化分析与逻辑梳理明确各因素的影响权重,厘清不同因素间的相互作用机制,揭示预算约束、专业需求、个人偏好等核心变量对购买决策的驱动路径与制约关系,为后续需求匹配与机型推荐提供底层逻辑支撑。
(二)需求 - 配置对应体系与指标构建
结合大学生不同的学习场景与使用需求差异,建立 “核心使用需求 - 硬件配置标准” 的精准对应关系,细化不同场景下的性能阈值与功能优先级,构建一套兼具科学性与实用性的机型选择指标体系,实现从专业需求到硬件配置的标准化转化,解决不同专业学生配置选择模糊的问题。
(三)分场景机型推荐方案制定与实践赋能
基于核心影响因素分析结果与专业配置指标体系,结合不同预算区间(低、中、高)的消费能力差异,制定分专业、分预算的精准机型推荐方案,明确各推荐机型的适配场景、核心优势及选择逻辑,形成可直接落地的购买参考指南,为大学生提供高效、合理的购机决策支持,帮助其规避配置不符、预算超支等问题;同时为电脑厂商提供消费需求洞察,助力厂商优化产品结构、精准定位目标市场,实现供给与需求的高效匹配,提升行业资源配置效率。
三、研究思路
本研究遵循“需求解构-产品画像-匹配计算-个性化推荐”的逻辑链条,系统搭建研究思路,以实现从需求洞察到精准推荐的全流程科学分析。在用户侧需求解构环节,首先采集大学生电脑购买的原始需求数据,随后对这些数据开展需求清洗与分类工作,将清洗后的需求映射到CPU、内存、存储、显示屏、显卡、电池、便携性、价格这8大核心维度。在此基础上,通过频次分析统计各维度在需求中出现的频率,结合用户偏好评分构建“用户需求画像”,明确各维度的用户侧权重,完成对大学生需求的深度洞察。于产品侧特性画像构建环节,先整理笔记本电脑产品库,从库中提取各机型的产品特性数据,同样围绕上述8大核心维度进行特征拆解。为确保权重分配的客观性,应用熵权法基于产品数据计算各维度的产品侧权重,再结合维度客观评分构建“产品特性画像”,实现对笔记本电脑产品特性的系统解构。最后在加权匹配与个性化推荐环节,结合“用户需求画像”的维度权重与“产品特性画像”的维度权重及对应关系,计算加权匹配度评分,并依据评分生成契合大学生个性化需求的电脑机型推荐列表,最终完成从需求到推荐的全流程闭环。

图1 研究框架图
第二章 数据抓取与数据预处理
一、用户需求数据抓取及处理
为精准捕捉大学生群体的笔记本购买需求特征,本研究聚焦抖音、小红书两大青年用户高度聚集的社交消费平台,针对“笔记本购买需求”相关内容的评论区开展定向数据抓取工作。初始阶段共获取原始数据记录2261条,为确保数据的有效性与纯净度,通过严格数据清洗流程,剔除广告推广、无效灌水、重复冗余等干扰信息后,最终形成有效数据集1894条。数据集不仅涵盖了大学生对价格预算、性能配置、品牌口碑、外观设计等多维度需求的原生表达,更因平台的社交互动属性,具备极高的真实性与时效性,为后续核心影响因素识别、用户需求画像构建及精准匹配模型搭建等研究环节,奠定了扎实且具代表性的实证基础。

图2 数据清洗与去重效果
二、笔记本电脑产品库数据抓取及处理
为构建支撑机型推荐的笔记本电脑产品库,本研究首先进行了系统性的数据采集与预处理工作。
(一)数据来源与采集
本研究选取https://detail.zol.com.cn/这一国内领先的测评网站作为数据来源。该平台汇聚了主流电脑品牌的全系列机型,其产品参数信息以规范性强、维度丰富著称,能够为研究提供涵盖硬件配置、价格区间及外观设计等在内的精准且全面的核心数据。基于此,研究通过定向网络爬虫技术,抓取了平台上当前市场热度较高的笔记本电脑产品数据,初步整理为5个独立的Excel文件,共计249条独立产品记录,作为本研究的初始数据源。
(二)数据预处理流程
为确保数据质量,为后续的模型构建与精准推荐奠定坚实基础,本研究设计并执行了一套多步骤的数据预处理流程,具体如下:
1.数据合并与去重
首先利用pandas库的concat方法将上述5个独立的Excel文件中的数据集进行纵向合并,形成一个统一的原始数据集。为保证每款机型的唯一性,以“产品型号”作为唯一标识键,对合并后的数据进行重复记录的识别与剔除。数据统计显示,经合并与去重操作后,共得到包含189条独立产品记录的基础数据集。
2.字段级深度清洗与结构化转换
原始抓取的数据中,部分关键产品参数以非结构化的文本形式存在,难以直接用于量化分析。为此,本研究设计了一系列基于规则和正则表达式的解析函数,对这些文本字段进行深度清洗与结构化转换:①CPU信息提取与标准化:通过正则表达式从描述文本中精准提取CPU主频、最高睿频等关键数值;将“12 核心 / 16 线程”、“8C/16T”等多样化的核心线程表述,统一转换为标准化的“核心数”和“线程数”两个量化字段。②关键参数数值提取:对缓存大小、制程工艺(纳米)、笔记本电脑重量(千克)等参数进行数值提取与单位标准化。③存储容量单位统一:将内存容量和硬盘容量的计量单位(如 “GB”、“TB”)统一转换为 GB(1TB = 1024GB)。对于存在多个硬盘描述的情况,取其容量最大值作为该字段的最终值。④屏幕参数解析:从屏幕分辨率描述中拆分出横向像素和纵向像素两个独立字段;从屏幕刷新率描述中提取具体的赫兹(Hz)数值。⑤电池容量提取:从电池类型及容量的复合描述中,提取以瓦时(Wh)为单位的电池容量数值,支持“70 瓦时”、“56Wh”等多种表述形式的准确识别。
通过上述步骤,原始的非结构化文本参数被成功转化为结构化、可量化的分析字段。
3.数据集精简
在完成字段级清洗后,为提高数据处理效率并降低模型复杂度,对数据集进行了进一步精简。删除了冗余的原始文本字段(如“CPU 系列”、“CPU 型号”、“核心代号”等,其信息已被新生成的结构化字段涵盖)以及在清洗过程中可能产生的少量重复记录。仅保留经过清洗和转换后生成的衍生字段(如 CPU_clock_speed、“核心数”、“内存容量(GB)”等),形成了中间数据集。
4.缺失值处理
为保障数据的完整性与后续分析的准确性,对数据集中的缺失值进行了系统性处理。针对不同类型的字段,采用了差异化的填充策略:①数值型字段(如价格、CPU主频、核心数、电池容量等):采用中位数进行填充,以减少极端值对数据分布的影响,保持数据的集中趋势;②文本型字段(如操作系统、散热系统、附带软件等):优先采用众数进行填充;若某字段不存在明显的众数,则使用“Unknown”(未知)作为填充值。此策略有效处理了数据集中的缺失值问题,确保了数据的完整性。

图2 缺失值处理情况展示
5.文本特征量化
为实现产品特性的全面量化评估,以便更好地与用户需求进行匹配,本研究对部分关键的文本特征进行了评分映射,将其转化为可计算的数值指标:①散热系统评分:基于散热系统描述中提及的风扇数量(单/双/三/四风扇)、热管数量(单/双/三/四/六热管)以及是否采用特殊散热结构(如VC均热板、液金散热等),构建了一个0-1区间的散热评分体系。②电池续航评分:结合电池类型(如聚合物电池/锂电池)、容量(Wh)以及芯数(3/4/6 芯)等信息,构建了一个 0-1 区间的电池续航评分体系。③软件生态评分:根据操作系统类型(如Windows/macOS/HarmonyOS/Linux等)以及是否附带办公软件(如 Office/WPS 等),构建了一个 0-1 区间的软件生态评分体系。
这些量化评分将原本难以直接比较的文本特征转化为可计算的指标,为后续 “产品特性画像” 的构建及与用户需求的精准加权匹配提供了关键支持。
(三)最终数据集
经过上述一系列严谨的数据采集与预处理流程后,最终形成的笔记本电脑产品库数据集,不仅涵盖了品牌、型号、硬件配置量化指标、价格等基础属性,还融入了散热、电池续航及软件生态等衍生的特性评分。该数据集结构规整、信息完备、准确性高,为后续笔记本电脑机型推荐模型的构建与验证提供了坚实可靠的数据基础。

图3 数据集部分产品和内容展示
第三章 个性化推荐
一、用户需求画像
(一)词频统计与高频词可视化
为确保对大学生笔记本购买需求的精准捕捉,本研究针对数据预处理后形成的有效用户需求记录,开展系统性词频统计与高频词可视化分析。具体操作中,借助自然语言处理技术,先通过分词工具(如Python jieba库)对需求文本进行精准分词,同时引入自定义停用词表(包含语气词、无意义助词等)剔除干扰词汇;再利用词频统计算法对处理后的词汇进行频次量化。为直观呈现用户需求的核心分布,采用词云图、高频词柱状图等可视化形式,将词汇频次差异以具象化方式呈现。通过对高频词的深度解析,可明确识别出用户在价格预算、性能配置、品牌口碑、专业适配、外观便携等维度的关键诉求表达,进而为后续从用户需求中提取核心特征值、构建科学的“用户需求画像”筑牢实证根基,保障后续影响因素识别、权重确定及匹配模型构建的科学性与针对性。

图4 评论高频词

图5 评论词云图
从用户评论的高频词统计与可视化结果中,可清晰捕捉大学生电脑购买需求的核心特征:预算是最突出的核心关注点,其词频在高频词中遥遥领先,结合此前权重分析,充分表明价格敏感度是大学生购机决策的首要考量;打游戏是性能场景的核心诉求,体现出娱乐场景对硬件性能的刚性需求;专业(如计算机、设计类专业的编程、建模、剪辑等)与办公(PPT、Excel、office等办公软件应用、论文撰写)是重要的使用场景,反映了学业对设备功能的适配要求;同时,“剪辑”“续航”“散热”“内存”等配置细节,以及“追剧”“上网”等日常非专业场景的使用需求也被广泛关注。这些高频词共同构成了用户需求的“关键词图谱”,为后续识别核心影响因素、构建用户需求画像提供了直观且扎实的实证依据。
(二)特征重要性分析
为量化识别大学生电脑购买决策中的核心影响因素,本研究以预处理后981条有效用户需求评论为分析样本,结合自然语言处理与熵权法开展特征重要性评估,具体流程与结果如下。
首先进行分析数据准备与维度定义,通过Python读取清洗后的数据文件并定位评论文本列,同时基于前期需求洞察构建“性能需求、便携性、续航能力、散热要求、屏幕与显示、内存与存储、软件生态、预算区间”八大影响维度,每个维度匹配核心关键词,形成标准化的分析框架。
随后开展词频统计与覆盖度计算,借助结巴分词工具对每条评论文本进行分词处理,统计各维度关键词的总出现频次,同时记录包含该维度关键词的评论数量以计算评论覆盖率(覆盖评论数/总评论数),形成“关键词总频次-评论覆盖率”双指标评估体系。
为客观量化各维度重要性,采用熵权法进行权重计算:先通过Min-Max标准化方法对双指标进行归一化处理,消除量纲差异;再通过计算指标的信息熵值衡量其离散程度,熵值越低表明指标区分能力越强、权重占比越高;最终通过熵值转化为各维度权重,并结合标准化指标计算综合重要性得分。 该分析结果通过客观数据验证了不同影响因素的实际作用强度,避免了主观赋权的偏差,为后续构建用户需求画像、建立“需求-产品”匹配模型提供了核心权重依据,确保机型推荐的科学性与针对性。
表1 八大影响因素特征重要性分析
| 维度 | 关键词总频次 | 评论覆盖数 | 评论覆盖率 | 重要性得分 |
| 预算区间 | 1974 | 1271 | 0.671067 | 0.460426 |
| 性能需求 | 1296 | 918 | 0.484688 | 0.310250 |
| 软件生态 | 728 | 343 | 0.181098 | 0.129908 |
| 便携性 | 238 | 216 | 0.114044 | 0.046390 |
| 屏幕与显示 | 205 | 180 | 0.095037 | 0.035406 |
| 续航能力 | 161 | 104 | 0.054910 | 0.015294 |
| 内存与存储 | 87 | 83 | 0.043823 | 0.002326 |
| 散热要求 | 79 | 76 | 0.040127 | 0.000000 |

图6 八大影响因素特征重要性分析
从表1与图6的量化数据及可视化结果中,可清晰把握大学生电脑购买决策的影响因素权重分布:预算区间以0.4604的重要性得分占据绝对核心地位,其关键词总频次达1974次,覆盖1271条评论,评论覆盖率超67.1%,充分体现价格敏感度是大学生购机的首要决策驱动因素;性能需求以0.3103的重要性得分位居第二,关键词总频次1296次,覆盖918条评论,反映出专业学习(如编程、建模)与游戏娱乐场景对硬件性能的刚性需求;软件生态、便携性、屏幕与显示、续航能力、内存与存储的重要性得分依次递减,说明这些维度对购机决策存在一定影响但优先级显著低于预算与性能;散热要求的重要性得分为0,关键词总频次和评论覆盖数均处于最低水平,表明其在用户需求中的决策权重可忽略不计。这一权重分布为后续构建“需求-产品”匹配模型、制定分场景机型推荐策略提供了明确的优先级依据。
(三)用户需求画像构建
为精准刻画大学生电脑购买的需求分布特征,本研究基于清洗后的用户评论数据构建用户需求画像,具体实现如下:首先,读取包含“评论”字段的清洗后数据集,调用预先定义的八大需求维度及其关键词字典(涵盖性能需求、便携性、续航能力、散热要求、屏幕与显示、内存与存储、软件生态、预算区间,每个维度匹配如“性能、算力、建模”等核心关键词)。 随后,利用结巴分词工具对每条评论文本进行分词处理,逐维度统计关键词的总出现频次;再通过“各维度频次/总频次”的计算逻辑,将频次转化为需求权重,最终形成包含“维度-频次-权重”的用户需求画像。该流程通过客观的文本分析与量化计算,规避了主观赋权的偏差,精准呈现了大学生在电脑购买决策中各需求维度的强度分布,为后续“用户需求-产品特性”的加权匹配模型搭建,提供了核心的用户端数据支撑,确保机型推荐与用户真实需求的高度契合。
表2 用户需求画像
| 维度 | 频次 | 权重 |
| 性能需求 | 992 | 0.284322 |
| 便携性 | 238 | 0.068214 |
| 续航能力 | 161 | 0.046145 |
| 散热要求 | 79 | 0.022643 |
| 屏幕与显示 | 205 | 0.058756 |
| 内存与存储 | 87 | 0.024936 |
| 软件生态 | 728 | 0.208656 |
| 预算区间 | 999 | 0.286328 |

图7 用户需求权重分布图

图8 用户需求权重比例图
从量化数据中,可明确大学生电脑购买需求的维度分布特征:预算区间以999次的关键词总频次和0.2863的权重占据核心地位,与性能需求(992次,0.2843权重)的权重占比极为接近,共同构成用户购机决策的两大核心诉求,体现价格敏感度与性能要求的双重重视;软件生态以728次频次、0.2087权重位居第三,反映专业学习与办公软件兼容等场景的刚性需求;屏幕与显示(205次,0.0588权重)、便携性(238次,0.0682权重)等维度体现用户对设备使用体验与形态的关注;续航能力(161次,0.0461权重)、内存与存储(87次,0.0249权重)、散热要求(79次,0.0226权重)的需求权重相对较低。该用户需求画像为后续“用户需求-产品特性”的加权匹配模型构建,提供了精准的需求端权重依据,保障了机型推荐与用户真实诉求的高度契合。
二、产品特征画像
(一)数值化和归一化数据
1.散热系统映射规则
散热系统的评分通过风扇数量、热管数量、高级散热结构三个维度综合计算,最终得分不超过1.0。
①基于风扇数量
| 关键词 | heat_score(风扇基础分) |
| 单风扇 | 0.2 |
| 双风扇 | 0.4 |
| 三风扇 | 0.6 |
| 四风扇 / 四出风口 | 0.7 |
| 多区进风 / 多出风口 | +0.1(额外加分) |
②基于热管数量
| 关键词 | 加分(heatpipe_score) |
| 1 根 / 单热管 | +0.05 |
| 双热管 | +0.10 |
| 三热管 | +0.15 |
| 四热管 | +0.20 |
| 六热管 / 六根 | +0.30 |
特殊热管加分:
| 特征 | 加分 |
| 8mm 主热管 | +0.05 |
| 10mm 主热管 | +0.08 |
③高级散热结构
| 关键词 | heat_score 处理规则 |
| VC 均热板/Vapor Chamber | 直接设为 ≥ 0.8 |
| 液金散热 | +0.15(额外加分) |
| 超级散热、冰川散热、冰峰散热 | +0.15(额外加分) |
| Ultra散热系统、PRo散热系统 3.0 | +0.20(额外加分) |
如果同时出现VC + 双风扇 + 多热管,可以封顶为:heat_score = 1.0。最终热评分计算公式:
base = fan_score
base += heatpipe_score
base += advanced_bonus
heat_score = min(base, 1.0)
2.电池续航映射规则
电池续航评分由电池类型、电池容量(瓦时)、cell数三个维度加权计算。
①电池类型
| 类型 | 分数 |
| 锂聚合物电池 | 1.0 |
| 锂电池(普通锂电) | 0.8 |
②电池容量
从字符串中提取Wh数值(如 “53瓦时” 提取为53),再进行归一化:battery_wh_score = (Wh - 40) / (100 - 40)
③Cell数
| Cell数 | score |
| 3 芯 | 0.4 |
| 4 芯 | 0.6 |
| 6 芯 | 0.8 |
最终电池评分 battery_score:battery_score = 0.5 * battery_wh_score + 0.3 * battery_type_score + 0.2 * battery_cell_score
3.操作系统与软件生态映射规则
①操作系统
| 系统 | os_score |
| Windows | 1.0 |
| macOS | 0.8 |
| HarmonyOS | 0.6 |
| Linux | 0.5 |
| 系统 | os_score |
②软件生态附带软件
若“附带软件”字段包含“Office”“WPS”“正版”等关键词,score += 0.1。
最终Software Score为:
software_score = os_score + software_bonus
software_score = min(1.0, software_score)

图9 数值化归一化前五行结果展示
(二)产品特性画像构建
为实现用户需求与电脑产品的精准匹配,本研究通过多维度属性量化、特征矩阵构建与熵权法权重计算流程,完成产品特性画像的构建,具体如下:
1.产品属性量化与特殊维度处理
首先对清洗后的电脑产品数据集开展通用数值化处理,将所有属性列转换为数值类型(无效值标记为NaN),为后续分析奠定数据基础。在此基础上,针对特殊维度进行针对性量化:①散热要求维度,提取“散热”字段的字符串长度以量化散热设计复杂度(字符串越长代表散热设计越复杂),并对该长度值进行归一化处理,消除量纲差异,得到“散热评分”; ②便携性维度,采用多指标融合策略实现量化。通过正则提取屏幕尺寸并计算“屏幕尺寸反比”(屏幕越小理论上便携性越强),同时结合散热评分计算“散热反向指标”(散热设计越复杂通常设备越厚重,便携性越差),最终按7:3的权重融合两个子指标,再通过归一化得到综合便携性评分,实现便携性的科学量化。
2.产品特性矩阵构建
基于与用户需求维度一一对应的“八大分析维度”(性能需求、便携性、续航能力、散热要求、屏幕与显示、内存与存储、软件生态、预算区间),对量化后的产品属性按维度进行聚合,生成产品特性矩阵。对于各维度下的多属性列,取均值作为该维度的综合表现;对缺失值采用0值填补,确保矩阵完整性。该矩阵将产品的多维度异构属性转化为统一结构的特征向量,为后续与用户需求的加权匹配提供了结构化数据支撑。
3.熵权法生成产品维度权重
为客观确定产品端各维度的重要性权重,采用熵权法对产品特性矩阵进行分析:通过计算各维度指标的信息熵,衡量其在产品间的离散程度(熵值越低,维度区分能力越强、权重占比越高);再将熵值转化为各维度的熵权权重,形成产品熵权权重表。该过程完全基于数据的客观分布确定权重,避免了主观赋权的偏差,确保后续“用户需求-产品特性”匹配的科学性。
最终,本模块输出产品特性矩阵(展示产品在各需求维度上的量化表现)与产品熵权权重表(展示各维度在产品端的客观重要性),为“用户需求画像”与“产品特性画像”的加权匹配环节,提供了产品端的核心数据与权重依据。
从表3与表4的量化结果中,可明确产品端的维度重要性分布与特性表现:产品熵权显示,内存与存储(0.1986)、散热要求(0.1898)、屏幕与显示(0.1831)等维度权重位居前列,说明这些维度在产品库中具有较强的特性区分能力,是产品端差异的核心体现;而软件生态(0.0402)、预算区间(0.0264)、便携性(0.0206)的权重相对较低,表明其在产品特性上的区分度较弱。表4通过多维度加权聚合,呈现了前10款产品的综合匹配表现,这些标准化的加权得分矩阵为“用户需求-产品特性”的加权匹配模型提供了产品端的核心特征支撑,确保了匹配过程的量化性与科学性,为精准推荐奠定了产品侧的客观依据。
表3 产品熵权
| 维度 | 熵 | 差异度 | 权重 |
| 内存与存储 | 0.974069 | 0.025931 | 0.198582 |
| 散热要求 | 0.975215 | 0.024785 | 0.189801 |
| 屏幕与显示 | 0.976092 | 0.023908 | 0.183085 |
| 续航能力 | 0.976504 | 0.023496 | 0.179935 |
| 性能需求 | 0.978932 | 0.021068 | 0.161336 |
| 软件生态 | 0.994745 | 0.005255 | 0.040242 |
| 预算区间 | 0.996555 | 0.003445 | 0.026382 |
| 便携性 | 0.997305 | 0.002695 | 0.020636 |
表4 产品加权得分(前10行)
| 产品名称 | 加权得分 |
| Y9000P 2025 至尊版 | 0.781956117813961 |
| 惠普暗影精灵 MAX16(U9275HX/RTX5070Ti/32G/1T 黑色) | 0.707352533017373 |
| 灵刃 18 | 0.7024711413255578 |
| LEGION NX IAX10 | 0.6917796238005842 |
| 拯救者 Y9000P 2023 | 0.6503793101355078 |
| 16-am0004TX | 0.6464368126235026 |
| 耀世 16 Ultra | 0.6224764781412164 |
| 机械革命翼龙 15 Pro (R7 8845H/32GB/1TB/RTX4060) | 0.6168907886804884 |
| 天选 6 Pro 锐龙版 | 0.6009104258561779 |
(三)产品熵权与用户需求权重对比

图10 产品熵权与用户需求权重对比
从图10的柱状图中,可清晰把握产品端与用户端对八大维度的重要性认知差异。其中,性能需求的用户需求权重(0.312)远高于产品熵权(0.161),反映用户对性能的强需求是核心诉求,同时产品端该维度也具备一定区分度;软件生态的用户需求权重(0.159)高于产品熵权(0.040),体现用户对办公、专业软件兼容的重视,而产品端该维度差异度有限;屏幕与显示、内存与存储的用户需求权重(均为0.107)低于产品熵权(分别为0.183、0.199),说明这两个维度是产品端特性差异的核心维度,产品在这些维度的表现会显著影响匹配结果;预算区间的用户需求权重(0.105)高于产品熵权(0.026),凸显价格敏感度仍是用户购机的重要考量,产品端该维度区分能力较弱;便携性的用户需求权重(0.091)高于产品熵权(0.021),反映用户对便携性有一定需求,产品端该维度差异度低;续航能力、散热要求的用户需求权重(分别为0.065、0.054)低于产品熵权(分别为0.180、0.190),说明这两个维度是产品端特性差异的关键维度,产品在这些维度的表现对匹配结果影响显著。这种双向权重差异为“用户需求 - 产品特性”的加权匹配模型提供了核心依据——模型通过融合用户需求权重(反映需求强度)与产品熵权(反映产品维度区分价值),实现了对用户核心诉求与产品特性优势的精准结合,保障了推荐结果的科学性与契合度。
三、用户 - 产品加权匹配与个性化推荐结果生成
(一)个性化推荐结果生成
本研究构建的个性化推荐系统,其核心在于双权重融合的加权匹配模型与科学化推荐生成机制,通过量化用户需求优先级与产品特性差异化价值,实现精准匹配与高效推荐。
推荐生成阶段以双层权重融合为量化核心,形成完整的量化闭环:首先,基于“整体用户画像(30%)+ 个人文本需求(70%)”的比例融合生成个性化用户权重(可通过配置调整比例),再通过“个性化需求权重(70%)+ 产品熵权法权重(30%)”的二次融合构建组合权重,确保用户核心需求优先的同时,兼顾产品特性的客观差异。在此基础上,对各产品的维度性能得分进行加权求和计算:针对每个产品,将其在“性能需求、便携性、续航能力、散热要求、屏幕与显示、内存与存储、软件生态、预算区间”8大核心维度的客观性能得分,分别与对应组合权重相乘得到各维度加权得分,最终求和得到产品与用户需求的综合匹配度评分。随后,按综合匹配度评分降序排列所有产品,筛选出Top N(默认10)高匹配度机型,形成个性化推荐列表。该生成机制既贴合用户核心需求优先级,又能基于产品特性差异筛选最优选项,保障推荐结果的科学性与精准性。
本次研究选取如下用户需求描述作为典型实例(与系统测试文本一致):“女生 信息安全技术 不打游戏,PPT,Excel,word,ps,pr,wps,学编程Python,办公,上网课,追剧,内存要大,散热好一点,续航长,带永久office,不卡顿 5千以内”。基于本文构建的个性化推荐系统,首先通过UserProfileAnalyzer模块对文本语义进行深度解析:从“信息安全技术”“编程Python”“PS/PR”等关键词,结合专业学习场景规则,强化“性能需求”“内存与存储”维度权重;“女生”“日常携带使用”相关场景隐含提升“便携性”维度关注度;“永久Office”“WPS”直接突出“软件生态”维度诉求;“5千以内”通过预算约束规则强化“预算区间”的核心考量地位;“上网课”“追剧”则提升“屏幕与显示”维度权重。最终生成的用户需求画像中,三大核心关注维度及权重根据整体与个人需求融合结果确定,确保与用户实际诉求高度契合。
系统基于上述个性化画像与产品熵权法权重构建组合权重后,对加载的全量笔记本产品(产品数量以实际产品数据文件为准)在 8 大核心维度的性能得分进行加权匹配计算,最终生成定制化推荐方案。其中惠普暗影精灵 MAX 16(U9 275HX/RTX5070Ti/32G/1T 黑色) 以 0.702 的综合匹配得分位居榜首,匹配原因为 “预算区间良好(得分 0.75,满足个人需求 + 整体共性),性能需求良好(得分 0.69,满足个人需求 + 整体共性),屏幕与显示达标(得分 0.56,基本符合个人与整体需求)”;耀世 16 Ultra(0.693)、16-am0004TX(0.689)等机型也因在核心维度的出色表现进入推荐前列。具体推荐结果如下所示。
表5 最终推荐TOP10
| 排名 | 产品名称 | 匹配分数 | 匹配原因 |
| 1 | 惠普暗影精灵 MAX 16 (U9 275HX/RTX5070Ti/32G/1T 黑色) | 0.702 | 预算区间良好(得分0.75,满足个人需求 + 整体共性), 性能需求良好(得分 0.69,满足个人需求 + 整体共性), 屏幕与显示达标(得分0.56,基本符合个人与整体需求) |
| 2 | 耀世 16 Ultra | 0.693 | 预算区间优秀(得分 0.88,符合个人强需求 + 整体趋势), 性能需求良好(得分 0.61,满足个人需求 + 整体共性), 屏幕与显示良好(得分 0.69,满足个人需求 + 整体共性) |
| 3 | 16-am0004TX | 0.689 | 预算区间优秀(得分 0.85,符合个人强需求 + 整体趋势), 性能需求良好(得分 0.65,满足个人需求 + 整体共性), 屏幕与显示达标(得分 0.56,基本符合个人与整体需求) |
| 4 | Y9000P 2025 至尊版 | 0.676 | 性能需求良好(得分 0.69,满足个人需求 + 整体共性), 屏幕与显示达标(得分 0.56,基本符合个人与整体需求) |
| 5 | 天选 6 Pro 锐龙版 | 0.660 | 预算区间优秀(得分 0.87,符合个人强需求 + 整体趋势), 性能需求良好(得分 0.66,满足个人需求 + 整体共性), 屏幕与显示达标(得分 0.41,基本符合个人与整体需求) |
| 6 | 斗战者 N176 | 0.657 | 预算区间优秀(得分 0.90,符合个人强需求 + 整体趋势), 性能需求良好(得分 0.66,满足个人需求 + 整体共性), 屏幕与显示达标(得分 0.44,基本符合个人与整体需求) |
| 7 | 机械革命耀世 16 Pro (i9 14900HX/32GB/1TB/RTX4060) | 0.657 | 预算区间优秀(得分 0.86,符合个人强需求 + 整体趋势), 性能需求良好(得分 0.65,满足个人需求 + 整体共性), 屏幕与显示达标(得分 0.56,基本符合个人与整体需求) |
| 8 | 机械革命翼龙 15 Pro (R7 8845H/32GB/1TB/RTX4060) | 0.645 | 预算区间优秀(得分 0.93,符合个人强需求 + 整体趋势), 屏幕与显示达标(得分 0.56,基本符合个人与整体需求) |
| 9 | 16-am0000TX | 0.643 | 预算区间优秀(得分 0.90,符合个人强需求 + 整体趋势), 性能需求达标(得分 0.49,基本符合个人与整体需求), 屏幕与显示达标(得分 0.56,基本符合个人与整体需求) |
| 10 | 天选 6 Pro 酷睿版 | 0.643 | 预算区间优秀(得分 0.86,符合个人强需求 + 整体趋势), 性能需求良好(得分 0.61,满足个人需求 + 整体共性), 屏幕与显示达标(得分 0.41,基本符合个人与整体需求) |

图11 TOP10最推荐机型匹配度评分
(二)基于整体用户画像的个性化画像

图13 基于整体用户画像的个性化画像
从个性化用户画像的相关图表中,可清晰梳理出该用户需求的特征与权重构成逻辑:在最终权重分布中,预算区间与性能需求是用户的核心关注维度,两者最终个性化权重分别达到0.326与0.285,均被标注为“核心权重”,这与用户 “5 千以内”的预算约束、“运行流畅支持编程及PS/PR”的性能诉求形成直接对应,而屏幕与显示、内存与存储的权重也相对突出,分别为0.139与0.167,其余如软件生态、散热要求等维度的权重则处于0.1以下,直观体现出用户需求的侧重点较为集中。
结合整体用户权重与个人需求权重的对比可知,不同维度的权重构成存在明显差异:性能需求维度中,个人需求权重(0.343)显著高于整体用户权重(0.286),说明该用户对性能的诉求强于同类型整体用户;预算区间维度的整体用户权重(0.284)与个人需求权重(0.296)则较为接近,印证了该维度是同类型用户的共性需求,而便携性、续航能力等维度的整体与个人权重均处于较低水平,进一步明确这些并非用户的核心关注点。
个性化需求占比的饼图进一步强化了这一认知,预算区间、性能需求在核心需求(权重≥0.1)中的占比合计超过六成,其中预算区间占比32.6%、性能需求占比28.5%,内存与存储、屏幕与显示的占比则分别为10.8%与13.8%,剩余14.4%为其他需求,清晰呈现出用户需求的主次结构。而从个性化权重来源分解来看,核心维度的权重主要由个人需求贡献,比如性能需求、预算区间的个人需求权重贡献均高于整体用户权重,这意味着推荐系统在构建画像时,既有效放大了个人差异化诉求的影响,又保留了整体用户的共性特征,使得最终的权重分布既贴合该用户的实际诉求,又具备合理的类型共性基础。
(三)推荐结果评估

图12 TOP10产品核心维度热力图
从图12中,可清晰把握各核心维度的得分分布特征:屏幕与显示维度的得分呈现出较高的集中性,其中得分处于0.562区间的产品数量最多,达到了6款,另有2款产品的得分落在0.405区间,0.687与0.437区间则各有1款产品分布。性能需求维度的得分多集中在0.60至0.69的中高匹配区间,其中0.688、0.606、0.665与0.647这几个得分区间分别对应2款产品,仅有Top8与Top9在该维度的得分低于0.5,分别为0.345与0.488。预算区间维度的表现则更为突出,多数产品的得分处于0.8以上的高匹配区间,这样的产品共计8款,仅Top4在该维度的得分相对较低,为0.361;而在高得分区间中,0.861区间出现了2次,其余高得分区间则各对应1款产品。内存与存储维度的得分分布中,0.467区间的产品数量占据多数,达到了5款,0.333区间则有4款产品,只有Top4在该维度取得了满分1.000的表现。
从集中趋势来看,以核心的性能需求维度为例,所有产品在这一维度的得分平均分为0.605,中位数则为0.627,这意味着性能需求维度的得分中心水平处于0.6至 0.63 区间,既体现出多数产品在这一核心需求维度的匹配度较为接近,也反映出推荐模型在核心维度的输出结果具有一定的集中性,能够较为稳定地覆盖用户的核心需求。
第四章 结论与总结
(一)结论
本研究围绕大学生笔记本电脑个性化推荐场景,构建了“用户需求精细化洞察-产品特性客观量化-双权重融合匹配-可视化可解释推荐”的完整体系,得出以下核心结论:
1.大学生电脑购买决策的核心影响因素呈现显著的优先级分层特征
通过对1894条有效用户需求数据的词频统计与熵权法分析,明确预算区间(重要性得分0.4604)与性能需求(重要性得分0.3103)是决定购买决策的两大核心维度,关键词总频次分别达1974次与1296次,评论覆盖率均超48%,充分反映出大学生群体“预算有限、性能刚需”的消费特征;软件生态、便携性等维度虽有影响但权重较低,而散热要求的决策权重可忽略不计,这一分布为需求画像构建提供了明确的优先级依据。
2.双权重融合的匹配机制实现了需求与产品的精准量化对接
研究通过“整体用户画像(30%)+ 个人文本需求(70%)”的初次融合,既保留了群体消费共性,又放大了个人差异化诉求;再经“个性化需求权重(70%)+ 产品熵权(30%)”的二次融合,兼顾了用户需求强度与产品特性区分价值,形成科学的组合权重体系。基于该机制对 189 款产品的 8 大核心维度进行加权计算,生成的Top10推荐列表综合匹配度集中在0.643-0.702区间,平均分0.670,中位数0.659,核心维度(预算、性能)得分呈现高度契合性,验证了模型的科学性与精准性。
3.多维度量化与可视化技术提升了推荐系统的实用性与可解释性
研究通过正则解析、评分映射等方法,将CPU参数、散热设计等非结构化文本转化为可计算的数值指标,构建了规范的产品特性矩阵;同时借助词云图、权重分布图、热力图等可视化手段,直观呈现需求分布、匹配差异及核心维度表现,使推荐结果不仅“精准”且“可解释”,解决了传统推荐系统“黑箱”问题,为用户决策与厂商优化提供了明确的数据支撑。
(二)总结与展望
1.总结
本研究以解决大学生电脑购买“选择困境”为核心目标,通过完整的“数据采集 - 预处理 - 画像构建 - 匹配推荐 - 结果评估”流程,构建了适配大学生群体的个性化推荐体系,实现了研究目的与实践价值的统一。
在理论层面,研究系统梳理了大学生电脑购买的影响因素与作用机制,构建了“需求 - 配置 - 选择”的关联分析框架,填补了现有研究对大学生细分群体电脑消费行为关注不足的空白,为消费行为学、市场营销学等领域提供了新的实证参考;同时,双权重融合的量化方法与多维度可视化技术,为个性化推荐领域提供了可复用的技术路径。
在实践层面,研究成果具备三重应用价值:对大学生而言,可帮助其快速定位核心需求,规避配置不符、预算超支等问题,提升消费决策效率;对电脑厂商而言,揭示了不同专业、场景下的需求痛点,为产品研发、精准营销提供数据支撑;对高校而言,可作为新生设备购置的参考依据,间接保障教学与科研活动的顺利开展。
2.展望
尽管本研究取得了预期成果,但仍存在一定局限:其一,数据来源集中于抖音、小红书及京东平台,可能存在样本偏差,未能覆盖线下消费、其他电商平台的需求特征;其二,模型未考虑实时价格波动、产品口碑动态变化等时效性因素,推荐结果的动态适应性有待提升;其三,个性化维度未完全涵盖品牌偏好、外观颜色、售后服务等用户潜在诉求。
未来研究可从三方面进一步拓展:一是扩大数据来源,整合线下调研、多平台数据,纳入时效性指标,构建动态更新的需求与产品数据库;二是优化模型结构,引入机器学习算法(如协同过滤、深度学习),增强对复杂需求的识别能力,同时增加品牌、外观等个性化维度,提升推荐的全面性;三是拓展应用场景,将本研究的技术框架迁移至手机、平板等其他消费电子产品的推荐中,形成普适性的个性化推荐体系,进一步提升研究的应用价值与推广空间。
注:本项目为2025-26-1学期《商务智能》结课报告。
引用格式:周定霜、项祥涛、尹雨、毛宇希,大学生电脑购买影响因素分析和机型选择推荐,公众号《用数说》,2025.11
《商务智能》课程
教材:万欣、夏火松、吴江编著,《大数据分析与挖掘实用案例教程》,电子工业出版社,2022
实验教材:万欣,《大数据分析与挖掘实验教程》,电子工业出版社,2023
学习参考:万欣、角志浩、徐栋 ,《AI提示工程——基础 •应用•实例》,电子工业出版社,2024
新书推荐

欢迎大家关注我们的大模型科普系列推文!
1. 大模型减肥秘籍:蒸馏、RAG和微调,让AI更轻盈
2. 从0到1认识AI Agent
3. AI 聊天机器人背后的奥秘:从抽样策略到人类反馈强化学习
4. 探秘Transformer
5. MCP:让AI更好地理解你的意图
6. AI修仙指南之八大神经网络详解及实践
7. DeepSeek-R1:强化学习驱动的推理能力提升,开源AI新纪元
8. DeepSeek 的核心思想与技术贡献总结
9. DeepSeek:开源与高效技术驱动大语言模型革新
10. 基于规则的奖励函数用于大模型自主生成思维链数据
11.想召唤AI为你打工?这份2025年AI智能体「驯兽指南」请收好!
12.AI智能体及其原理与应用
13.多智能体系统理论、技术与框架
🌊 《AI 冰山系列》科普连载<br/>第一篇:冰山之上与冰山之下——AI 成本的隐形真相<br/>第二篇:数学现实——为什么自主智能体难以大规模落地?<br/>第三篇:上下文的陷阱——Token 成本与经济学的不可承受之重<br/>第四篇:工具工程——为什么 70% 的工作其实不在 AI?<br/>第五篇:集成地狱——现实世界为什么比 API 文档复杂得多?<br/>第六篇:人机共舞——AI 时代的可靠性边界<br/>第七篇:未来展望——AI 智能体的正确姿势
<br/>欢迎大家阅读:
1. 大语言模型辅助撰写国家自然科学基金申请书——以经管类为例
2. 国家自然科学基金(经管类)申报书撰写全流程指南——基于DeepSeek的智能辅助方法
3. 国家社会科学基金申报书撰写指南(经管类)——基于DeepSeek辅助
4. DeepSeek推荐的2025国家自科、社科基金管理科学与工程方向的研究题目及研究方法(附辣嘴版)
5.2025年国家社科与自科项目(管理学)趋势分析报告
<br/>更多请阅读
- AIGC赋能教育教学
- AIGC赋能论文写作
- AIGC赋能各专业科普与职业规划
- 大模型科普系列
- 商务智能课程教学实践及创新
- 拼图项目式教学设计及其在商务智能课程中的实践
- 能动性学习教学方法探索与实践--《商务智能》授课记录与总结(2020)
- 大数据时代的数据驱动与理论驱动结合的研究生《商务智能》结课作业的相关资料
- 遵循OBE工程教育理念的教学实践与思考-以《最新数据库管理系统》课程为例
- 《商务智能》课程学生作业
- 教师教学日记
- 教师教学总结
- 大数据挖掘与智能技术
- 七七八八
- 中南民大21-22-2学期《商务智能》教学总结
- 大模型时代的设计机遇与挑战
- 大模型冲击下服装与服饰设计专业的职业变迁与发展路径
- AIGC时代管理学如何做好实证研究(理论篇)
- AIGC时代管理学如何做好实证研究( 案例篇)
- 大模型解读:AIGC赋能质性研究
- 基于AIGC的质性研究实践——"90"后群体的价值变迁及其影响因素
- Claude 3大模型引起学界关注,或将开启科研新范式
- AI提效学术写作的利与弊
- AIGC时代的起航:信息管理与信息系统专业学生的学习和职业发展规划
- AIGC赋能跨境电商:内容生产力飞跃与职业发展新机遇
- AIGC赋能跨境电商
- AIGC赋能市场营销
- AIGC赋能物流工程与管理
- AIGC赋能工商管理
- AIGC赋能智能财务
- AIGC赋能经管财会
- 机器学习和生成式人工智能在塑造营销未来中的应用
- 人工智能时代管理科学与工程教育如何因时而变
- 大模型解读:目标后阶段的奖励众筹群体行为
- 大模型解读:网红在校老师直播带货对购买意愿的影响
- 大模型解读:2024年国家社科基金研究热点预测分析——管理类
- 大模型解读:大学生就业难问题形成机制分析
- 大模型解读:2024年国家社科基金研究热点预测分析——新质生产力与数字化篇
- 使用ChatGPT等人工智能工具赋能管理研究