该项目负责人是深圳大学管理学院的杨金娟,项目成员是王雨鹏、孙慧莹。本项目主要内容包括:一、投资者对项目简介文本信息的感知对股权众筹的影响。学者已证实目标金额、已筹集金额、出让股份大小等易获取的结构性数据对众筹成功均有显著的影响。研究发现投资者在浏览众筹项目时首先关注摘要,如果对摘要不感兴趣,仔细阅读全文的可能性会很小。二、投资者对创业团队照片图像信息的感知对股权众筹的影响。天使投资人和风险投资人在进行投资决策时非常看重创业团队的相关特质。三、机器学习的信息感知对股权众筹的影响。人工智能与机器学习的发展给传统计量经济学带来不小的冲击,线性的机器学习模型对股权众筹结果的预测更为准确。
本项目的创新之处主要体现在以下三个方面:①基于信息不对称理论,从信号感知视角利用机器学习中的自然语言处理技术和人脸识别技术增强投资者对股权众筹项目披露的文本信息和图像信息的认知能力,补充了影响股权众筹成功的因素;
②将机器学习中的经典预测模型BP神经网络应用到对股权众筹项目成功率的预测中,通过与传统计量模型的对比,实证检验机器学习预测的科学性和准确性,为机器学习在金融领域的应用提供了一个很好的范例;③利用机器学习技术,通过新指标的选取和预测模型的完善,提高了投资者对股权众筹项目的甄别能力,进而提高了投资者的投资效率。
本项目经结项验收,符合结项要求。其最终成果为:
论文:人工智能可以有效提高股权众筹项目的投资效率吗?——基于投资者信息感知视角的实证
人工智能可以有效提高股权众筹项目的投资效率吗?
——基于投资者信息感知视角的实证
【摘要】人工智能通过降低投资者认知的有限性提高了投资者的信息感知能力进而提高其决策效率。以聚募网公布的145起股权众筹项目为研究对象,利用传统的回归模型和基于机器学习的神经网络模型来预测项目成功的概率。研究发现,将文本和图像信息加入评估模型中会有效提高投资者对股权众筹项目的投资效率;且BP神经网络模型的预测准确率高于传统的Probit模型。
【关键词】股权众筹;文本分析;图像识别;BP神经网络;随机森林一、引言
在互联网金融的时代浪潮下,股权众筹在我国经济转型的关键时期应运而生,尤其是在李克强总理提出“大众创业、万众创新”的口号后,创业企业的大量涌现推动了股权众筹的快速发展。股权众筹在解决我国小微创业企业融资问题和促进创新创业方面发挥着重要的作用。股权众筹平台的服务对象主要是尚未成型的创业企业或创意项目,投融资双方存在一定的信息不对称性,投资者无法获得众筹项目的所有信息,较高的风险和较大的不确定性增加了投资者项目选择的难度。参与众筹的投资者需要具备一定的信息判断和感知能力,股权众筹的参与者多数不是专业投资者,即使优质的众筹项目能发出信号,投资者也未能有效识别。因此,从信息感知视角研究投资者如何有效利用已有的信号做出科学的判断显得尤为重要。
基于信号理论,提高投资者的信息感知能力可以有效降低投融资双方的信息不对称性。信息感知是用户吸收和利用信息的开端,用户自身的认知经验、知识结构和信息存在的状态都会对用户的信息感知产生影响。投资者的信息感知能力同时受其获取信息的宽度和掌握信息的深度两方面的影响[1]。由于受数据获取与数据处理等技术问题的限制,在股权众筹的现有研究中,信息获取来源多集中于传统的数值型数据,对文本数据、图像数据和音频数据等新型载体所蕴含的信息则关注较少,减小了投资者获取信息的宽度;以往研究对数据的处理大都采用传统的计量模型,人为设定变量之间的关系为线性关系,在一定程度上限制了对信息的认知深度。随着大数据时代的到来,大量且多样化的信息对投资者的信息感知能力带来了前所未有的挑战,传统的数据获取和处理技术在大数据面前显得捉襟见肘。
人工智能通过其自然语言处理技术、图像识别和机器学习等技术为投资者信息感知能力的提高提供了强有力的技术支持。自然语言处理技术和图像识别技术能够发现非结构化数据的有趣特征并加以描述,从数据获取上拓宽了投资者获取信息的宽度。大数据背景下众多学科交叉融合,很多新兴领域借助大数据得到越来越多研究者的关注,机器学习就是其中的热门研究方向之一[2]。机器学习是实现人工智能的重要方法,着眼于数据挖掘与模型预测,对模型没有过多苛刻的假定。当数据样本量大、维度多、关系复杂时,机器学习在数据拟合及模型预测方面的优势就愈加明显,有效地提高了投资者处理信息的深度。因而越来越多的学者进入机器学习领域,让大数据分析更好的服务于学术研究和管理实践。本文从信息感知视角讨论人工智能如何通过提高投资者获取信息的宽度和掌握信息的深度来提高其在股权众筹项目中的投资效率。本文的贡献体现在三个方面:一是基于信号理论,从投资者信息感知的角度,探讨了项目简介和创业团队成员照片对股权众筹项目融资成功率的影响,补充了股权众筹项目融资成功与否的影响因素。二是利用人工智能中的自然语言处理技术和图像识别技术增强投资者对股权众筹项目披露的文本信息和图像信息的认知能力,拓宽了投资者信息获取的宽度;利用机器学习中的经典预测模型BP神经网络和随机森林算法对影响股权众筹项目成功与否的因素进行处理,加深了投资者信息分析的深度。三是利用人工智能进行变量选取和模型建立,通过与传统计量模型的对比,实证检验了人工智能在处理非常规数据和模型预测方面的优势,为人工智能在金融领域的应用提供了一个很好的范例。
第二部分为理论分析与假设,第三部分为研究设计,第四部分为实证分析,第五部分为结论。二、理论分析与假设
本文主要基于信号理论,探讨人工智能在股权众筹项目投资中是否会提高投资者对投资项目的信息感知能力,从而提高投资效率。在股权众筹中,投资者相较于筹资者而言,处于信息劣势,无法获得股权众筹项目的所有信息,投融资双方存在一定的信息不对称性。为解决经济生活中的信息不对称问题,信号理论应运而生[3],信号理论主要包括信号传递和信甄别两大方面,信号传递(Signalingmodel)指信息优势方先行动,通过可观察的行为传递商品价值或质量的确切信息,信号甄别(Screeningmodel)则指信息劣势方先行动,主动对信息做出甄别。在股权众筹领域中,可以通过融资者主动的信息披露(信号传递)和投资者的信息感知(信号甄别)来有效降低投融资双方面对的信息不对称程度。
现有关于股权众筹信息不对称问题的研究,重点关注项目筹资者的主动信息披露行为对降低筹资者和投资者之间信息不对称性的影响,如Courtney等[4]基于信息经济学,提出创业者通过媒体渠道向投资者传递项目相关信息可以有效降低筹资者和投资者之间的信息不对称性,提高项目募资成功的概率;彭红枫和米雁翔[5]以京东东家私募股权融资平台的83个融资成功的项目验证了筹资者的信号传递在一定程度上降低了双方的信息不对称性,促进了股权众筹项目的成功。也有学者同时从筹资者和投资者的视角研究了双方释放的信号在降低信息不对称时的作用[6-7]。从投资者信息感知视角来研究如何降低筹资者和投资者之间信息不对称性的较少。在金融领域,很多学者利用投资者的认知能力来解释投融资双方面对的信息不对称性,从投资者有限关注的视角把投资者的认知能力当作一种有限资源来研究[8-10],即投资者认知能力的有限性直接限制了投资者对项目信息的感知水平,进而影响了信号传递者所传递信息的有效性。人工智能的发展,在技术层面有效降低了有限认知对投资者信息感知能力的限制。因此,以人工智能技术为依托,从投资者信息感知视角来研究投融资双方的信息不对称问题可以突破传统认知能力的限制,提高投资者的决策效率。
图 1 信号传递理论在股权众筹市场上的应用模型
从图1可以看出,信号感知阶段是投资者做出投资决策前最重要的一个环节,主要包括获取数据并对相关数据做出处理。受限于传统的数据分析处理工具,以往投资者大多利用传统的计量经济模型对项目相关的数值型数据进行线性分析。随着信息披露形式的多样化,文本信息、图像信息甚至是音频信息的出现都对投资者的数据获取和分析带来了前所未有的挑战,传统的技术无法较好地处理非数值型数据,计量模型提供的线性拟合在一定程度上也无法满足投资者的数据分析需求,当面对股权众筹平台发布的大量项目信息时,投资者对信息的理解、判断或感知存在一定的偏差。专业投资者根据积累的知识和经验可以较准确判断项目的优劣,降低其面对的信息不对称性,但参与股权众筹平台大多是非专业投资者,如何科学地根据已有信息做出判断是投资者最为关注的话题。人工智能则在数据获取和处理方面提高了投资者信息获取和处理的宽度及深度,通过提高投资者的信息感知能力进而提高了投资者的决策效率。
作为一种新兴的互联网金融模式,股权众筹项目所涉及到的相关信息均借助互联网平台在线上披露,因而投资者无法像投资传统项目那样与融资者进行面对面沟通交流,投资者对项目的了解均来自于股权众筹平台上披露的信息。综合各专业股权众筹平台的信息披露模式,可以将股权众筹项目披露的信息总结为两类,即与项目本身相关的特征和与创业团队相关的特征[11-12]。综观国内外学者对影响股权众筹项目融资成功与否因素的研究也大多从以上两个方面展开。关于项目本身所传递信息对股权众筹项目成功与否的研究,现有文献主要从目标金额、最低起投额、已筹集金额、出让股份大小等易获取的结构性数据对众筹项目的成功与否进行分析。Mollick[13] 研究发现,目标金额的设置讲究技巧,太少无法吸引潜在投资者,太多则需要承担目标无法实现的风险。黄玲和周勤[14]基于期望理论指出目标金额较低、项目新颖度越高以及差异化设置回报种类的众筹项目成功的可能性越大。最低起投额的限制越低,参与投资的人数越多,投资者可以较高的分散风险[15]。出让股份份额大小与成功率存在负向相关关系[16]。随着股权众筹披露信息的不断丰富,投资者对众筹项目的关注扩大至创业团队信息。诸多经验丰富的早期投资者透露在进行投资决策时非常看重创业团队的相关特质。王巧然和陶小龙[17]研究表明创业者先前经验中的创业经验与行业经验对创业绩效具有显著的正向影响。吴文清等[18]发现,团队组织规模对股权众筹项目成功与否并无显著影响;钱颖和朱莎[15]则认为团队人数代表企业的人力资本,团队人数越多,说明团队的综合实力越强。另外,还有研究还具体分析了创业团队在性别、年龄、经验、教育水平等方面的异质性对创业绩效的影响[19]。
可以发现,上述对股权众筹项目特征和团队特征的研究主要利用传统的结构化数据,并未捕捉到股权众筹项目中文本和图像所蕴含的信息。随着计算机技术的革新,关于股权众筹相关特征的数据量不断扩大,数据处理与数据分析方法也在不断的完善,本文则以筹资者在股权众筹平台发布的信息为基础,从投资者的信息感知视角来研究人工智能在处理文本信息和图像信息时对降低投融资双方信息不对称性的作用。
(一)文本的信息感知:项目简介
随着大数据以及人工智能在金融领域的广泛应用,学者们对项目特征的讨论不再局限于传统的数值型数据。从投资者的行为模式来看,已有文献发现读者在阅读论文时首先关注摘要,如果对摘要不感兴趣,仔细阅读全文的可能性会很小[20]。对Kickstarter、“众筹网”、“聚募网” 等国内外知名众筹平台调查,可以发现项目简介均被置于显著位置。类似的,如果股权众筹项目的项目简介文本不能吸引投资者,投资者也不会阅读项目的详细内容,并评估项目的投资价值 [21]。由此可见,项目简介等文本是影响投资者投资意愿的第一要素。由于传统计量经济学方法的限制,现有研究对股权众筹项目标题、项目简介等文本信息分析的较少,仅王伟等[20]借助文本挖掘方法,从众筹项目简介语言风格的说服性角度进行分析,表明不同的语言风格会改变投资者对项目前景的感知,进而影响他们的投资意愿。
基于以上分析,我们猜测项目简介的相关特征对股权众筹的成功有显著影响。具体哪些特征起到了主导作用则是我们研究的重点。文本的可读性通过发挥信号作用,可以缓解借款人与投资人之间的信息不对称程度,可读性强的文本不仅能够减少信息的噪声,降低投资者信息筛选的成本,还可以向投资者释放一种积极的信号[22]。基于此,提出本文的假设。
H1a:项目简介的可读性越强,股权众筹项目融资成功的概率越大。
当然,文本传递的不仅包括信息,更蕴含了撰写者的情感,情感分析也是近几年来较热的话题。国外关于情感倾向的分析较多,如ACL、COLING、AAAI等涉及人工智能领域的国际顶级会议都收录了文本情感分析的论文[23],国内的研究则相对较少。有研究证明,广告宣传采用过于夸张的手法不利于消费者了解该品牌,从而降低购买意愿[24]。同样,政治领导人的传记如果采用夸张手法,会降低可信度[25]。但李桂华等[26]基于扎根理论构建文本情感表达丰裕度指标,研究虚拟社区标题和内容的情感丰裕度对用户浏览和回帖的影响,证实高情感丰裕度的帖子吸引了更多浏览者的关注。文本情感在不同的场合会有不同的作用,互联网金融平台的投资人是否会受到项目情感的影响,还有待检验。基于此,提出本文的假设。
H1b:项目简介的情感倾向越积极,股权众筹项目融资成功的概率越小。
启发式判断是心理学的一个概念,指在不确定条件下,人们会根据以往的经验(相同的类似的甚至是无关的)来对当前情况进行判断[27]。人的决策主要由直觉系统和推理系统做出,推理系统对直觉系统的监控是松懈的,这就使得启发式判断有了可能[28]。当投资者面对一个新的投资项目时,无疑会根据之前接触到的项目做出启发式判断。在分析了项目简介文本可读性、情感性的基础上,根据股权众筹项目的分类,将每个类别中最成功的项目作为参照标准,把其他项目与该成功项目做文本相似度分析,“幸福的人都是相似的,不幸的人更有各的不幸”,我们推测成功的项目简介内容之间必定有某种相似之处,因此,两者项目简介的文本相似度也越高。根据人们做出决策时受启发式判断的影响可知,若一个项目与成功项目的文本相似度越高,则表明该项目成功的可能性也较高。基于此,提出本文的假设。
H1c:与成功项目的项目简介相似性越高,股权众筹项目融资成功的概率越大。
(二)图像的信息感知:创业团队照片
除上述对项目简介的文本分析外,有学者借助数据挖掘技术,对项目是否有视频介绍、是否有创业团队照片、项目更新次数等因素进行探讨[29],研究发现项目辅助信息的全面化、宣传形式的多样化可以向投资者传递质量信号,从而吸引更多投资者的关注,增加融资成功的机率。Yang [30]发现可识别肖像的可信度和情感对投资者的行为具有重要的影响。虽然“眼见为实”不是在所有情况下都成立,但创业团队上传照片的行为,以及投资者从照片中获取的信息都能够提高股权众筹项目展现形式的立体性,从而增加投资者对项目的信任程度。
众筹项目团队成员的颜值在一定程度上会影响创业团队对部分投资者的吸引力。进化论表明,人的容貌能够对外传递很多视觉上的信号,研究表明“颜值”高的人会被认为更有能力,表现更出色。Rule等[31]指出,CEO的外貌特征可以提供关于衡量公司财务业绩表现的客观信息。
HalfordandHsu[32]的研究表明,外貌特征比较吸引人的CEO具有较高的谈判能力和较高的识别度,会给公司股东创造更多的价值。互联网金融的兴起使得投资者的投资环境和方式发生了较大的变化,Gonzalez等[33]通过使用P2P平台Prosper的数据,发现在违约概率大致相同的情况下,漂亮申请者获得贷款的概率要比其他申请者高,且支付的利息更低。基于此,将创始团队成员照片的颜值视为股权众筹项目创业团队吸引力的代理变量,提出本文的假设。
H2a:股权众筹项目创业团队的吸引力越高,股权众筹项目融资成功的概率越大。
除颜值特征外,以创业团队成员照片的视觉效果为基础,利用图像识别技术还识别出各成员照片上的视觉年龄。创业者的个人特征会对创业行为甚至创业结果产生影响[34],占怡[35]以年龄作为创业者的个人特征之一对不同年龄阶段的个人在创业行为中的策略进行了研究,发现创业策略并没有受到创业者年龄差异的影响。然而,随着分工的不断细化和智能器械的大范围使用,专业人才成了各行业的稀缺资源,年龄年轻化受过系统科学训练的从业者甚至创业者势必会给所在行业带来新鲜的血液[36]。基于互联网平台的股权众筹作为创新项目融资的新渠道[37],其受众呈现年轻化的态势,且平台上项目多为基于互联网的技术型创新项目。因此,我们认为创业团队成员的年龄越年轻化,其对科技类创业项目的走向把握越准确,推出的新产品和新项目也更容易得到投资者的认可。基于此,将创始团队成员的年龄视为股权众筹项目创业团队年轻化的代理变量,提出本文的假设。
H2b:股权众筹项目创业团队越年轻化,股权众筹项目融资成功的概率越大。
在创业团队颜值和年龄特征的基础上,进一步识别了团队成员的面部表情特征,相由心生,个人的面部特征在一定程度上反映了其心理特征。个人的创业态度不仅会影响其创业倾向,还会对创业结果产生影响[38],阳光乐观的心态是发展的深层动力[39]。因此,创业团队积极的心态能向投资者传递出创业团队对自身项目的信心和乐观的信号,从而为该项目提供了隐形的担保,投资者也更倾向于投资此类项目。将创始团队成员面部表情为高兴视为股权众筹项目创业团队积极性的代理变量,提出本文的假设。
H2c:股权众筹项目创业团队积极性越高,股权众筹项目融资成功的概率越大。
(三)利用机器学习进行信息感知
随着计算机技术的不断革新,越来越多的数据可以被采集。大数据的发展,推动了学术界和业界对数据分析方法的深入研究与探讨[2]。对于传统的计量经济学学者来说,以往研究的都是局部的观测数据,一般仍需经人工的二次处理,数据的科学性有待检验。大数据背景下,不仅样本量快速增加,数据维度也在不断扩张,再加上大数据稀疏、高噪声与关系复杂等特点,使得传统计量经济学分析方法力不从心。由此,越来越多的学者开始关注数据解构与人工智能分析系统 [40]。其中,机器学习理论是从人工智能中延伸出来的,它是从样本中寻找规律,然后对无法观测的、未来的样本数据进行预测出的一种理论方法[41]。李雅婷和左文明[42]利用5种机器学习模型对股权众筹的结果进行预测,研究证实,BP神经网络模型更适合用于预测众筹项目的筹资结果;而在BP神经网络模型构建前通过随机森林算法选择相关变量的最优子集去训练模型则会在单独使用BP神经网络的基础上进一步提高模型预测的准确率。传统的计量方法只能分析结构化数据,而机器学习可以将非结构化或者半结构化的数据转换成结构化数据[43]。由于机器学习可以处理非结构化数据,大大扩充了数据分析的范围,故本文猜想其对股权众筹预测准确性具有改进作用。基于上述分析,提出如下假设:
H3:相较于线性计量方法,非线性的机器学习模型对股权众筹结果的预测更为准确。
一、研究设计
(一)样本选择
本文的实验数据来自聚募网(https://www.dreammove.cn/),聚募网是浙江省最大的互联网非公开股权融资平台,2014年8月创立于中国杭州,旨在帮助初创企业解决融资难、融资贵的问题。在国家严监管的背景下,我国目前正在运营的众筹平台数量较少,聚募网是其中一家经营良好、平台规范、信息公布较全面的众筹平台。截至2018年年末,累计融资额25431万元,累计认证投资人42000余人。
投资者只有在通过实名验证,成为合格投资者才可查看聚募网的项目信息。合格投资者可以查看平台上公布的所有项目,包括正在进行融资、融资成功以及融资失败的项目,这为我们获取数据提供了便利。通过对该网站截止2019年1月23日聚募网发布的196起股权众筹项目所有可视项目进行信息爬取,得到本文分析用到的项目基本信息。考虑到项目信息的完整性,先后剔除掉股东持股数据缺失(49个)、项目估值数据缺失(1个)和来源于第三方平台的项目(1个),最终进入本文进行实证分析的样本为145个,约占总样本的74.5%。
(二)研究设计
为了探讨股权众筹项目的文本和图像信息对项目成功的影响,如若在基础模型的基础上加入新的信息能提高模型预测的准确率,则表明该信息能够为投资者提供有价值的参考信息,提高投资者的投资效率。此处包括文本和图像两方面的信息:一是项目特征中项目简介文本中所蕴含的信息,如项目简介的可读性、情感倾向、与成功项目表述相似性等因素对项目成功的影响;二是团队特征中成员照片信息特征,若团队成员公布照片,则可以从照片中分析出项目团队的吸引力、年轻化程度、积极性等特征,继而探讨其对项目成功与否的影响。以往的计量分析主要以结构化数据为主,但人工智能的发展让文本、照片等非结构化数据为研究者所用。本文所用非结构化数据均以python作为脚本,借助百度AI接口实现数据处理,图像处理和文本处理都基于百度AI 平台保证了数据处理的一致性和可比较性。
1.变量的度量
项目融资成功的界定。以项目目标额为准,在项目合投期限内(30天),认投额等于或大于目标额为成功(Y=1),反之为失败(Y=0)。
项目简介。对项目简介这一文本信息的处理,主要借助百度AI平台提供的自然语言处理技术,从项目简介的可读性、项目简介的情感性和与成功项目的相似性等方面将文本信息转换为结构化的数据。具体的变量的定义及计算见表1。
团队成员照片。对团队成员照片的处理,主要借助百度AI平台提供的图像识别技术来检测照片中的信息。该技术可适应大角度侧脸、遮挡、模糊、表情变化等各种实际环境;在检测出人脸后,可对人脸进行分析,获得眼、口、鼻轮廓等150个关键点定位,准确识别多种人脸属性,如性别、年龄、表情等信息;重点关注团队成员照片呈现出的团队吸引力、团队的年轻化程度和团队的积极性,具体的变量定义及计算见表1。
其他相关变量
参照以往学界和业界的估值模型,在实证分析部分加入了控制变量,以控制除项目简介和成员照片之外的项目特征和创业团队特征对项目成功与否的影响。实证分析部分用的所有变量见表
1。
表 1 模型中涉及到的变量
变量特征 |
信息特征 |
变量名称 |
变量描述 |
|
|
项目融资成功(Y) |
Y=1,成功;Y=0,失败 |
项目特征 |
文本型 |
项目简介的可读性 |
利用深度卷积神经网络(DNN)模型来判断一句话是否符合语言表达习惯,输出分词结果并给出每个词在句子中的概率值。该值越小,说明越符合人类语言表达习惯。 |
项目简介的情感性 |
项目简介的情感得分,通过对包含主观观点信息的文本进行情感分类(积极=2、中性=1、消极=0),并给出相应的置信度。 |
与成功项目的相似性 |
以各项目类别中 DNN 得分最小的项目为标准,将同一类别中其他项目与之对比,得出文本相似度得分。该得分范围为 0 到 1,得分越高表明相似度越高,0 表示完全不相似, 1 表示完全相似。 |
数值型 |
目标金额 |
项目的目标筹资额(万元) |
起投额 |
投资者最低投资限额(万元) |
关注度 |
项目浏览人数取对数 |
项目估值 |
衡量公司的价值(万元) |
出让股权比例 |
为筹集资金公司愿意出让股权的占比 |
是否基于互联网创业 |
人工整理,是=1,否=0 |
创业团队特征 |
图像型 |
团队的吸引力 |
用团队成员的颜值均值表示,颜值均值=团队成员颜值总得分/团队总人数 |
团队年轻化程度 |
用团队成员的年龄均值表示,年龄均值=团队成员年龄加总/团队总人数 |
团队的积极性 |
用成员照片的表情表示,照片心情为高兴则表示团队越积极,照片心情显示为高兴的人数/团队总人数 |
数值型 |
团队人数 |
创业团队总人数 |
成员照片 |
有照片成员人数/团队总人数 |
男性占比 |
男性成员人数/团队总人数 |
前 3 大股东持股比例 |
前 3 大股东持股比例加总 |
第 1 大股东是否 CEO |
是 CEO,取值为 1;反之则为 0 |
有创业经验 |
有创业经验成员人数/团队总人数 |
有行业经验 |
有行业经验成员人数/团队总人数 |
学士学位 |
有学士学位成员人数/团队总人数 |
硕士学位 |
有硕士学位成员人数/团队总人数 |
博士学位 |
有博士学位成员人数/团队总人数 |
MBA 学位 |
有 MBA 学位成员人数/团队总人数 |
|
|
海外留学 |
海外留学成员人数/团队总人数 |
2.研究方法的设计
针对本文提出的两个假设,主要设计了Probit模型、BP神经网络、随机森林和BP神经网络模型三种模型来解决研究问题。
(1)Probit模型
以往学者认为股权众筹项目的项目特征、创业团队特征等因素会对项目的成功与否产生影响,基于此,通过观察项目披露的信息就可以推测该项目成功的概率,即:
Pr Y Xn = f Xn + ε ⑴
其中,Xn表示项目披露的基本信息,通常指可以直接用来进行数据分析的结构化数据。随着人工智能的发展,将非结构化数据转化为结构化数据,增加人们投资决策时可用的信息量,对于做出正确的投资决策具有重要的意义,因此,可以使用项目简介文本中和创业团队成员照片中包含的信息来辅助预测项目成功的概率,式(2)和式(3)是分别加入项目简介文本特征和成员照片特征后项目成功概率的表达式。
Pr Y Xn,Xi = f Xn,Xi + ε ⑵
Pr Y Xn,Xj = f Xn,Xj + ε ⑶
其中,Xi为项目简介文本中包含的信息, Xj为成员照片中包含的信息。若项目简介中包含的文本信息和创业团队成员照片中包含的信息对判断项目的成功与否具有参考价值,则式(2)和式(3)的概率均要大于式(1)。
式(4)在式(1)的基础上,同时加入项目简介和创业团队成员照片中包含的信息,若项目简介文本中和团队成员照片中包含的信息对判断项目成功与否具有参考意义,则式(4)的概率要大于式(1)、式(2)和式(3)。
PrYXn,Xi,Xj = f Xn,Xi,Xj + ε ⑷
通过式(2)、式(3)、式(4)与式(1)概率大小的比较来验证假设1和假设2。
BP神经网络模型
神经网络采用梯度下降法和特征缩放法求得最优的回归参数,对于大规模的数据量和特征指标,神经网络的多个非线性的层(和参数)基本上可以学习任何类型的映射关系,因此对更适合复杂的建模环境及大数据量的仿真模拟;并且人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点。本文属于模式识别范畴里的自然语言处理,模式识别是对表征事物或现象的各种形式的信息进行处理和分析,来对事物或现象进行描述、辨认、分类和解释的过程。该技术以贝叶斯概率论和申农的信息论为理论基础,对信息的处理过程更接近人类大脑的逻辑思维过程。人工神经网络是模式识别中的常用方法,近年来发展起来的人工神经网络模式的逐渐取代传统的线性预测方法。
预测是数据挖掘领域中一个涉及面非常广泛的研究课题。将预测运用于股权众筹模式研究,能够为股权众筹创业者提供有效的信息反馈,同时为非专业投资者提供有价值的参考。无论是有效性、收益性还是提升性,神经网络模型均好于传统的线性模型,其中以神经网络中的BP神经网络模型为最佳预测模型[35]。此处基于聚募网的股权众筹项目,使用BP神经网络对项目的成功与否进行预测。以所有项目的85%作为训练集,以剩下的15%的项目检验模型的准确率,进而不断训练模型,使之达到更好的预测效果。为了与传统的线性模型做比较,依照式(1)至式(4)分别构建4个神经网络模型,并与相应的传统回归模型做比较,若BP神经网络预测的准确性高于传统的线性模型,则验证了本文提出的假设3。
随机森林和 BP 神经网络
随机森林是一种监督学习算法,通过建立多个决策树并将它们合并在一起以获得更准确和稳定的预测。本文模型三的BP神经网络构建与模型二类似,差别在于在训练神经网络模型前,先利用随机森林算法在所有变量中找出最优决策子集,再使用找出的最优决策子集去训练BP神经网络,进一步提高模型的拟合程度和精度。变量的添加过程及训练集和预测集的选择均和模型二保持一致。
二、实证分析
(一)描述性统计
1. 项目特征
图2左半部分为聚募网145起股权众筹项目所在地的区域分布图,右半部分为各个地区股权众筹项目的具体数量。由于聚募网是浙江省的投资平台,平台上有102个项目的项目所在地位于浙江省,江浙沪地区的项目总数占到总样本的82%,由此可见,聚募网重点辐射江浙沪一带的初创企业,但平台上也不乏远至新疆、云南、黑龙江等地区的项目。
图 2 项目所在地区域分布图
项目简介是除项目标题外,投资者对一个投资项目了解的重要窗口,一个好的项目简介关系到投资者对项目的总体印象及评价,因此实证部分主要基于百度AI开放平台提供的自然语言处理技术对145起股权众筹项目的项目简介进行了DNN得分(判断一句话是否符合语言表达习惯)、情感倾向得分、文本相似度分析等处理,表2是对项目简介及所有项目特征变量的描述性统计分析结果。
由表2可知,在145起股权众筹项目中,最终融资成功的项目占总样本的67.59%;股权众筹项目的项目简介平均有63.9448个汉字,其中,最少的有9个,最大的有100个,不同的项目之间存在较大的差异;项目简介的可读性得分分布区间为77.0939到3742.7100,分布不均匀,说明不同的项目简介在是否符合人们的阅读习惯上存在较大的差异;项目简介的情感性得分的分布范围为0到2,均值为1.8207,项目简介的情感倾向高涨;股权众筹项目的项目简介与成功项目相似性的均值为0.2382。
表 2 项目特征描述性统计
变量 |
观测值 |
均值 |
标准差 |
最小值 |
最大值 |
项目融资成功 |
145 |
0.6759 |
0.4697 |
0 |
1 |
项目简介的字数 |
145 |
63.9448 |
23.9156 |
9 |
100 |
项目简介的可读性 |
143 |
717.8828 |
508.6833 |
77.0939 |
3742.7100 |
项目简介的情感性 |
145 |
1.8207 |
0.5357 |
0 |
2 |
与成功项目的相似性 |
143 |
0.2382 |
0.2049 |
0 |
1 |
目标金额(万元) |
145 |
123.0791 |
114.0613 |
0.0100 |
1000 |
起投额(万元) |
145 |
0.7599 |
0.8677 |
0 |
10 |
关注度 |
145 |
9310.3790 |
4792.5080 |
1289 |
25793 |
项目估值(万元) |
145 |
2418.9720 |
6297.558 |
70 |
66667 |
出让股权比例 |
145 |
13.0570 |
13.1933 |
0 |
100 |
是否基于互联网创业 |
145 |
0.5862 |
0.4942 |
0 |
1 |
项目筹资目标金额的均值为123.0791万,最少为0.01万,最多为1000万,创业者的资金需求存在较大的差异。145个项目的起投额从0到10万不等,平均起投资金为0.7599万元。投资者对项目的关注度平均为2418.9720人次,其中关注度最低的项目是 TeaKa新茶饮,为1289 人次,关注度最高的项目是网络剧《夏天的烦恼》,为25793人次。项目估值的最小值为70万元人民币,最大值约为6亿元,其中,估值最低的项目为意佰度滋活披萨西湖文化广场店,估值最高的项目为基于互联网平台的餐饮项目——要吃啥。出让股权比例最低的为虚拟项目聚募APP,出让股权比例最高的项目为博芮客浙大校友店。在总样本中,基于互联网创业的项目占到58.62%。
根据百度AI开放平台提供的基于自然语言处理的文章分类技术,把145个项目进行分类,最终的项目分类结果如下:科技类项目最多,占26%;社会和财经次之;由于项目细分类别较多,将比例不超过5%的合并在一起,构成其他类。
2.创业团队特征
创业团队成员是影响创业项目能否成功的重要因素之一,除成员学历、经历、经验等传统考核指标外,团队成员的照片也能反应出创业团队的特征,如创业团队的吸引力、年轻化程度、积极性等非强制性公开信息,这些都会影响投资者对项目成功率的判断。因此实证部分主要基于百度AI开放平台提供的图像识别技术对145起股权众筹项目的创业团队照片进行了处理,表3是对成员照片及所有创业团队特征变量的描述性统计分析结果。
表 3 项目团队成员信息的描述性统计
变量 |
观测值 |
均值 |
标准差 |
最小值 |
最大值 |
成员照片 |
145 |
0.7658 |
0.3753 |
0 |
1 |
团队的吸引力 |
145 |
39.0845 |
20.9840 |
0 |
77.4160 |
团队的年轻化程度 |
145 |
21.2461 |
11.0564 |
0 |
39.6667 |
团队的积极性 |
145 |
0.2897 |
0.3707 |
0 |
1 |
男性占比 |
145 |
0.4797 |
0.4406 |
0 |
1 |
团队人数 |
145 |
4.9655 |
2.4872 |
1 |
22 |
前 3 大股东持股比例 |
145 |
0.2757 |
0.4268 |
0 |
1.0500 |
第 1 大股东是否是 CEO |
145 |
0.3931 |
0.4901 |
0 |
1 |
有行业经验 |
145 |
0.7875 |
0.3108 |
0 |
1 |
有创业经验 |
145 |
0.2222 |
0.2168 |
0 |
1 |
学士学位 |
145 |
0.4237 |
0.3422 |
0 |
1 |
硕士学位 |
145 |
0.1250 |
0.2045 |
0 |
1 |
博士学位 |
145 |
0.0217 |
0.0749 |
0 |
0.4286 |
MBA 学位 |
145 |
0.0267 |
0.0732 |
0 |
0.5000 |
海外留学 |
145 |
0.0495 |
0.1080 |
0 |
0.5000 |
由表3可知,每个团队中对成员照片的披露程度约为76.58%,团队的吸引力得分最小值为0,最大值为77.4160,各项目团队成员的年龄均值约为21岁,创业团队偏年轻化,男性创业者占到样本总人数的47.97%,团队中成员照片心情为高兴的占比约为28.97%,积极性高的团队占样本四分之一左右。样本中团队成员人数最少为1人,最多为22人,其中人数最多的项目为线上线下职业教育机构;前3大股东持股比例的均值为27.57%,有39.31%的项目第1大股东为CEO。平均每个团队中有行业经验的人员占比为78.75%,有创业经验的人员占比为22.22%;团队成员的学历构成从学士学位、硕士学位到博士学位依次减少,因项目类型的不同,博士学位的成员在各个团队中分布差异较大;各个团队中获得MBA学位的人员占比约为2.67%,有海外留学经历的占比为
4.95%。在后续的回归分析中,将团队成员的学历特征,如学士学位、硕士学位等进行主成分分析,取特征根大于1的因子代替团队成员的学历,并命名为学历特征。
(二)基本结果
表 4 基于Probit模型的回归结果
|
(1) |
(2) |
(3) |
(4) |
|
数值型信息 |
加入文本信息 |
加入图像信息 |
加入文本图像信息 |
项目简介的情感性 |
|
-0.948** |
|
-0.853* |
|
|
(-1.992) |
|
(-1.769) |
项目简介的可读性 |
|
-0.322 |
|
-1.045 |
|
|
(-0.316) |
|
(-0.899) |
与成功项目的相似性 |
|
1.994 |
|
1.991 |
|
|
(1.469) |
|
(1.336) |
团队的吸引力 |
|
|
-0.016 |
-0.016 |
|
|
|
(-0.769) |
(-0.710) |
团队的年轻化程度 |
|
|
-0.171*** |
-0.167*** |
|
|
|
(-2.928) |
(-2.749) |
团队的积极性 |
|
|
1.446*** |
1.376** |
|
|
|
(2.584) |
(2.444) |
成员照片 |
|
|
4.700* |
4.439* |
|
|
|
(1.952) |
(1.748) |
男性占比 |
|
|
0.128 |
0.282 |
|
|
|
(0.267) |
(0.571) |
团队人数 |
-0.059 |
-0.049 |
-0.090 |
-0.059 |
|
(-1.021) |
(-0.800) |
(-1.423) |
(-0.894) |
目标额 |
-0.001 |
-0.001 |
-0.001 |
-0.001 |
|
(-0.710) |
(-0.382) |
(-0.578) |
(-0.396) |
起投额 |
0.049 |
-0.038 |
0.050 |
-0.032 |
|
(0.294) |
(-0.222) |
(0.269) |
(-0.170) |
关注度 |
1.720** |
1.905** |
1.332 |
1.438 |
|
(2.061) |
(2.103) |
(1.490) |
(1.510) |
项目估值 |
-1.130 |
-1.164 |
-1.439 |
-1.501 |
|
(-0.539) |
(-0.560) |
(-0.652) |
(-0.671) |
出让股权比例 |
0.032* |
0.036* |
0.035** |
0.040** |
|
(1.829) |
(1.945) |
(2.048) |
(2.194) |
是否基于互联网创业 |
0.570* |
0.475 |
0.738** |
0.607 |
|
(1.957) |
(1.496) |
(2.104) |
(1.605) |
前3大股东的持股比例 |
0.533 |
0.421 |
0.720 |
0.655 |
|
(1.295) |
(0.981) |
(1.531) |
(1.346) |
第一大股东是否为CEO |
0.392 |
0.453 |
0.397 |
0.455 |
|
(1.161) |
(1.264) |
(1.108) |
(1.194) |
有创业经验 |
-1.205** |
-1.211* |
-1.698** |
-1.678** |
|
(-2.004) |
(-1.814) |
(-2.465) |
(-2.231) |
有行业经验 |
-0.036 |
0.014 |
-0.097 |
-0.083 |
|
(-0.074) |
(0.026) |
(-0.191) |
(-0.153) |
学历特征 |
0.059 |
-0.053 |
-0.023 |
-0.133 |
|
(0.565) |
(-0.456) |
(-0.204) |
(-1.042) |
常数项 |
-0.908 |
0.225 |
0.079 |
1.170 |
|
(-1.146) |
(0.181) |
(0.085) |
(0.845) |
行业 |
控制 |
控制 |
控制 |
控制 |
地区 |
控制 |
控制 |
控制 |
控制 |
观测值 |
134 |
132 |
134 |
132 |
R方 |
0.212 |
0.254 |
0.304 |
0.336 |
模型预测准确率 |
72.39% |
72.73% |
73.88% |
78.03% |
(t statistics in parentheses:* p<0.1,** p<0.05,*** p<0.01)
1.基于Probit的回归结果
表4为基于Probit模型的回归结果,列(1)到列(4)分别对应上文中的式(1)到式(4),其中,列(1)是基本模型,列(2)在列(1)的基础上加入了项目简介的文本信息,列(3)在列(1)的基础上加入了创业团队的图像信息,列(4)在列(1)的基础上加入了项目简介的文本信息和创业团队的图像信息。从列(1)到列(4),模型的拟合优度逐渐提高,模型预测的准确率也在不断提升。从列(1)到列(4)模型的拟合优度和预测准确度来看,将项目简介和创业团队成员照片等信息加入到模型中,确实提高了模型的说服力,为投资者在选择投资项目时提供了有价值的参考信息。
列(1)为基础回归结果,在不考虑项目简介的文本信息和创业团队的图像信息,只考虑传统的影响因素时,模型的拟合优度为21.2%,预测的准确率为72.39%。
列(2)为加入项目简介的回归结果,模型的拟合优度为25.4%,预测的准确率为72.73%。项目简介的可读性的系数为负,由于项目简介可读性的衡量指标DNN得分为反向指标,所以项目简介的可读性与股权众筹项目的成功率正相关,当项目简介更符合表达习惯时(DNN分值越小时),项目更倾向于成功,但项目简介的可读性在统计意义上并不显著,在一定程度上部分验证了本文的假设H1a;项目简介的情感性与项目的成功率负相关,即项目简介描述的情感越积极,则项目越不容易成功,并且在统计意义上显著,说明平台上现有的理性投资者居多,并不为项目简介中渲染性的描述所动摇,而是坚持做理智的判断,初创企业在进行项目简介时可以忽略夸张性的语句,客观的向投资者介绍创业项目,本文的假设H1b得到验证;与成功项目的相似性的系数为正,表示当一个新项目的项目简介与本文定义的成功项目之间的相似度越高时,该项目更倾向于成功,但文本相似度在统计意义上并不显著,本文的假设H1c得到了部分验证。以上关于项目简介三个方面特征的分析表明,相比于与成功项目的相似性、项目简介的可读性而言,项目简介的情感性是影响项目成功与否的关键因素,项目情感表述越高亢,项目越容易失败。列(3)将创业团队照片中所包含的信息加入到列(1),模型的拟合优度提高到30.4%,模型预测准确度为73.88%。披露项目成员的照片与项目的成功率显著正相关,这说明创业团队披露成员照片时,能给投资者传递更多的参考信息,在一定程度上降低了双方的信息不对称性,有利于投资者对股权众筹项目的成功与否做出更好的判断。团队的吸引力与项目的成功率负相关,且在统计意义上不显著,这说明投资者相对比较理性,创业团队的颜值相较于其他特征的重要性要低,假设H2a没有得到验证;创业团队的年轻化程度与项目的成功率显著负相关,投资者更看好年轻化的创业团队,会给予年轻的创业团队更多的支持,而对于年龄相对较长者参与的创业项目则不太看好,假设H2b得到验证;当团队的积极性较高时,即成员照片的表情为高兴时,会向投资者传递一种积极、乐观、自信的信号,相比于其他面部表情,创业团队积极性高的股权众筹项目更容易成功,假设H2c得到验证。
列(4)将列(2)和列(3)中涉及到的项目简介特征和创业团队照片特征的所有变量都加入模型中,模型的拟合优度提高到33.6%,模型预测的准确率提高到78.03%,关键变量的系数均未发生显著的变化,对项目成功与否的预测更加精确。从列(1)到列(2),从列(1)到列(3)同样验证了假设1和假设2;同时通过机器学习对人类无法大批量处理的文本信息和图像信息进行感知,从而提高模型的拟合优度和预测准确率,也在一定程度上验证了假设3,即机器在处理非结构化数据捕获信息的能力上要比人具有优势。
除项目简介和创业团队成员照片在对股权众筹项目的筛选中起到不可忽视的作用外,我们同时还发现,项目估值越高,项目越倾向于失败;出让股权比例越高,项目越倾向于成功;当创业项目基于互联网时,更容易获得投资者的青睐。
综上,项目简介的文本信息和创业团队的照片信息确实在预测股权项目成功与否中发挥了重要的作用,基于自然语言处理技术和图像识别技术的发展,充分考虑项目简介文本中包含的信息和创业团队照片中所包含的图像信息,在提高模型的精确度的同时更为投资者带来了评估项目好坏的新指标。
2.基于BP神经网络的预测结果
以总样本的85%作为训练集合,剩下的22个项目作为预测集合。在模型构建阶段,将85%的训练样本再细分成十份,进行十折交叉验证,提高算法的准确率。在预测阶段,依据传统回归模型变量的添加思路,根据变量的差异分别做了四次BP神经网络拟合,通过实验,得到了四个BP 神经网络模型预测集上的混淆矩阵,见表5-表8。
表5为基本模型,即只包含项目特征和创业团队特征中传统数据信息的BP神经网络模型的混淆矩阵。
表 5 BP神经网络混淆矩阵1.0
|
成功 |
失败 |
合计 |
成功 |
12 |
2 |
14 |
失败 |
3 |
5 |
8 |
该模型取伪错误为2个,弃真错误为3个,共错判5个,因此风险估计为0.2273,模型预测的准确率为0.7727。
表 6 BP神经网络混淆矩阵2.0
|
成功 |
失败 |
合计 |
成功 |
12 |
0 |
12 |
失败 |
3 |
7 |
10 |
合计 |
15 |
7 |
22 |
表6为在基础模型的基础上加入项目简介的文本信息后的结果,该模型取伪错误为0个,弃真错误为3个,共错判3个,因此风险估计为0.1364,模型预测的准确率为0.8636。
表 7 BP神经网络混淆矩阵3.0
|
成功 |
失败 |
合计 |
成功 |
14 |
1 |
15 |
失败 |
1 |
6 |
7 |
合计 |
15 |
7 |
22 |
表7为在基础模型的基础上加入创业团队照片信息的结果,该模型取伪错误为1个,弃真错误为1个,共错判2个,因此风险估计为0.0909,模型预测的准确率为0.9091。
表 8 BP神经网络混淆矩阵4.0
|
成功 |
失败 |
合计 |
成功 |
14 |
0 |
14 |
失败 |
1 |
7 |
8 |
合计 |
15 |
7 |
22 |
表8是在基础模型的基础上同时加入项目简介的文本信息和创业团队的照片信息的结果,该模型取伪错误为0个,弃真错误为1个,共错判1个,因此风险估计为0.0455,模型预测的准确率为0.9545。
3.随机森林和BP神经网络
本文进一步使用随机森林算法(RF)找出特征变量的最优子集,利用特征变量的最优子集再次对BP神经网络模型进行训练拟合,按照上述Probit模型和BP神经网络模型的构建思路,分
别建立了四个RF+BP模型,出错率分别为13.64%、9.09%、4.55%和4.55%。表9是Probit模型、
BP神经网络模型和FR+BP模型的预测准确率对比表。
表 9 Probit、BP神经网络、FR+BP模型预测结果比较表
|
数值型信息 |
加入文本信息 |
加入图像信息 |
加入文本图像信息 |
Probit 模型预测准确率 |
72.39% |
72.73% |
73.88% |
78.03% |
BP 神经网络模型预测准确率 |
77.27% |
86.36% |
90.91% |
95.45% |
RF+BP 模型预测准确率 |
86.36% |
90.91% |
95.45% |
95.45% |
由表9可知,无论是Probit模型、BP神经网络模型还是FR+BP模型,随着项目简介文本信息和创业团队照片信息的加入,模型的预测准确率均得到了提高;而不论从基础模型还是之后三个加入新变量的模型来看,按模型预测准确率由高到低排序,依次为FR+BP模型、BP神经网络模型、Probit回归模型。无论从特征变量的添加还是从模型的改进来看,机器学习均在一定程度上降低了投资者人工判断的主观性,提高了投资者对股权众筹项目的投资效率。以此,验证了本文的假设3。
三、结论
本文通过对聚募网平台145个股权众筹项目的研究,发现项目简介的情感性、创业团队的年轻化程度和团队的积极性等文本和图像信息都会对项目的融资产生影响,项目简介的情感倾向越积极,股权众筹项目的成功率越低;团队的年轻化程度越高、团队越积极则股权众筹项目越容易成功。将经过自然语言处理技术处理后的项目简介和经过图像识别技术处理后的创业团队成员照片信息加入模型中后,会明显提高模型的拟合优度和模型预测的准确度;同时,在使用传统线性预测模型的基础上,利用BP神经网络、随机森林和BP神经网络模型对项目进行训练,得到的预测模型准确率为95.45%,相比传统模型提高近17个百分点。可见,人工智能可以提升投资者获取信息的宽度和处理信息的深度,在一定程度上降低投资者认知的有限性,通过提高投资者的信息感知能力进而提高投资者的决策效率。在人工选择模型进行预测和将数据交由机器学习进行训练拟合进而预测这两种模式中,机器学习显然更胜一筹。
本文的研究对参与互联网股权众筹平台的投资者还是筹资者均有一定的启示意义。一方面,对于投资者来说,在评估项目进行投资时,不仅要关注以往惯用的结构化数据,更要积极使用现在正在兴起并飞速发展的人工智能去发现项目文本、图像中所蕴含的信息,借此去评估项目甚至获得超额收益,通过提高信息获取的宽度和信息处理的深度来提高个人的信息感知能力,从而降低主观投资判断的非理性;另一方面,对于筹资者来说,在发布项目进行融资时,除了将披露信息的重点放在数字信息上,关注数字信息的严谨、客观外,还要重视项目标题、项目简介、团队介绍、成员照片等文字信息的表述和图像信息的呈现。
随着大数据、人工智能、云计算等技术的发展,人们获取数据、处理数据进而信息感知的方式发生着翻天覆地的变化。在新型的金融市场中,无论是投资者还是筹资者,都应拥抱新技术,充分发挥“机器”的优势,驾驭浩瀚的数据,及时获取、有用、客观的信息、提高决策理性,优化决策效果。
【参考文献】
王春峰,李思成,房振明.投资者认知度、信息不对称与股价延迟[J].管理评论,2018,30(11):3-13.
廉梦鹤,郑玉平.大数据环境下计量经济学与机器学习理论比较研究[J].统计与管理,2016(12):105-106.
Spence, A. M. Market signaling: Informational transfer in hiring and related screening processes [M]. Boston: Harvard University Press, 1974.
Courtney, C., Dutta, S. and Li, Y. Resolving Information Asymmetry: Signaling, Endorsement, and Crowdfunding Success [J]. Entrepreneurship Theory and Practice, 2017, 41(2):265-290.
彭红枫,米雁翔.信息不对称、信号质量与股权众筹融资绩效[J].财贸经济,2017,38(05):80-95.
Courtney, C., Dutta, S. and Li, Y. Resolving information asymmetries: influence of media and crowd sentiment on crowd-funding success[J].Academy of ManagementAnnual Meeting Proceedings, 2016(1), 14663.
Usman,S. M., Bukhari, F.A. S., Usman, M., Badulescu, D. and Sial, M. S. Does the Role of Media and Founder’s Past Success Mitigate the Problem of Information Asymmetry? Evidence from a UK Crowd-funding Platform, Sustainability[J], MDPI, OpenAccess Journal, 2019, 11(3), 1-24.
Kahneman, D.Attention and Effort [M]. Englewood Cliffs: Prentice-Hall,1973.
Pashler, H., Johnston, J.C. and Ruthruff, E. Attention and Performance [J].Annual Review of Psychology, 2001, 52(1) :
629-651.
俞庆进,张兵.投资者有限关注与股票收益——以百度指数作为关注度的一项实证研究[J].金融研
究,2012(08):152-165.
黄健青,陈欢,李大夜.基于顾客价值视角的众筹项目成功影响因素研究[J].中国软科学,2015(06):116-127. [12] 黄健青,黄晓凤,殷国鹏.众筹项目融资成功的影响因素及预测模型研究[J].中国软科学, 2017(07): 91-100.
Mollick, E.R. The Dynamics of Crowd-funding: An Exploratory Study [J]. Social Science Electronic Publishing, 2014, 29(1):1-16.
黄玲,周勤.基于期望理论的众筹设计研究[J].财经科学,2015(06):32-42.
张天顶,胡颦杨.众筹项目融资效率、影响因素以及空间溢出效应[J].金融理论与实践,2017(12):91-96.
钱颖,朱莎.股权众筹投资者决策行为影响因素研究[J].科技进步与对策,2017,34(13):25-29.
王巧然,陶小龙.创业者先前经验对创业绩效的影响——基于有中介的调节模型[J].技术经
济,2016,35(06):24-34.
吴文清,付明霞,赵黎明.我国众筹成功影响因素及羊群现象研究[J].软科学,2016,30(02):5-8.
牛芳,张玉利,杨俊.创业团队异质性与新企业绩效:领导者乐观心理的调节作用[J].管理评
论,2011,23(11):110-119.
Ohtani, B. Preparing Articles on Photocatalysis beyond the Illusions, Misconceptions and Speculation[J]. Chemistry Letters, 2008, 37(3), 216-229.
王伟,陈伟,祝效国,王洪伟.众筹融资成功率与语言风格的说服性——基于Kickstarter的实证研究[J].管理
世界,2016(05):81-98.
陈霄,叶德珠,邓洁.借款描述的可读性能够提高网络借款成功率吗[J].中国工业经济,2018(03):174-192.
徐健锋,许园,许元辰,张远健,刘清.基于语义理解和机器学习的混合的中文文本情感分类算法框架[J].计算
机科学,2015,42(06):61-66.
Krishnan, B. C., Dutta, S. and Jha, S. Effectiveness of Exaggerated Advertised Reference Prices: The Role of Decision Time Pressure[J], Journal of Retailing, 2013, 89(1): 105-113.
Weber, P., and Wirth, W. When and How Narratives Persuade: The Role of Suspension of Disbelief in Didactic Versus Hedonic Processing of a Candidate Film[J]. Journal of Communication, 2014, 64(1):125-144.
李桂华, 余伟萍, 姜晓萍. 虚拟社区文本情感表达对用户参与的作用:模型构建与验证[J]. 情报学报, 2012,
31(8).
埃利奥特·阿伦森.《社会性动物》[M]. 上海:华东师范大学出版社社,2001.
Kahneman, D., and Frederick, S. Representative revisited:Attribute substitution in intuitive judgment[M]. New York: Cambridge University Press, 2002.
邱瑾,张淑楠.基于数据挖掘的互联网众筹成功进度分位数回归模型[J].统计与信息论
坛,2018,33(02):36-45.
Yang, X. The role of photographs in online peer-to-peer lending behavior[J]. Social Behavior & Personality: An International Journal, 2014, 42(3): 445-452.
Rule, N., Ambady, N. and Macrae, J.A.C. Us and them: memory advantages in perceptually ambiguous groups[J]. Psychonomic Bulletin & Review, 2007, 14(4):687-92.
Halford, JR., and Hsu SHC. Beauty is wealth:CEO appearance and shareholder value[R]. SSRN Electronic Journal, 2013, 1-40.
Gonzalez, L. and Komarova Loureiro, Y . When Can a Photo Increase Credit?: The Impact of Lender and Borrower Profiles on Online P2PLoans[J]. Social Science Electronic Publishing.
宋宇.创业行为的地区差异:以陕西与浙江为例的比较分析[J].中国软科学, 2009(S1): 180-187.
占怡.个人创业特征、创业效能感与创业行为策略的关系研究[D].浙江大学,2008.
段晓军.引航员年龄年轻化给引航事业带来的问题探索[J].中国水运(下半月), 2017, 17(07): 60-61+87.
郑海超,黄宇梦,王涛,陈冬宇.创新项目股权众筹融资绩效的影响因素研究[J].中国软科学,
2015(01):130-138.
王玉燕,林汉川,王建秀.背景异质性、创业态度与创业倾向关系的实证研究——以高校研究生为研究对象[J].
中国社会科学院研究生院学报, 2014(01):68-78.
陈忠.阳光乐观的社会心态是发展的深层动力——文明论视野中的青年心态[J].探索与争鸣,
2018(04):50-53.
王飞跃.知识产生方式和科技决策支撑的重大变革——面向大数据和开源信息的科技态势解析与决策服务[J].
中国科学院院刊,2012,27(05):527-537.
章永来,史海波,周晓锋,杨秀锋.基于统计学习理论的支持向量机预测模型[J].统计与决策,2014(05):72-74.
李雅婷,左文明.众筹项目筹资结果预测模型[J].统计与决策,2016(02):86-89.
王珏,石纯一.机器学习研究[J].广西师范大学学报(自然科学版),2003(02):1-15.