共查询到20条相似文献,搜索用时 0 毫秒
1.
深度强化学习进展: 从AlphaGo到AlphaGo Zero 总被引:1,自引:0,他引:1
2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜AlphaGo,再一次刷新人们对深度强化学习的认知.深度强化学习结合了深度学习和强化学习的优势,可以在复杂高维的状态动作空间中进行端到端的感知决策.本文主要介绍了从AlphaGo到AlphaGo Zero的深度强化学习的研究进展.首先回顾对深度强化学习的成功作出突出贡献的主要算法,包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展.然后给出AlphaGo Zero的详细介绍和讨论,分析其对人工智能的巨大推动作用.并介绍了深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域的应用进展,以及相关资源进展.最后探讨了深度强化学习的发展展望,以及对其他潜在领域的人工智能发展的启发意义. 相似文献
2.
3.
《电子制作.电脑维护与应用》2017,(16)
人工智能技术在近几年得到了快速的发展,并且广泛地应用于人们的生活中。2016年AlphaGo与李世石进行的人机围棋大战再一次掀起人工智能研究的热潮。本文详细地论述了人工智能程序AlphaGo的四个神经网络的工作原理,研究了蒙特卡洛树搜索算法在其运算中的作用。同时以AlphaGo为例,分析人工智能是否会引发智械危机,并尝试为人工智能的研究提供新思路。最后展望了人工智能在未来的发展。 相似文献
4.
5.
自1956年人工智能概念提出后,人工智能技术得到了快速发展,并逐渐成为当前及未来最前沿的科学技术。人工智能的应用可以进一步发挥计算机网络技术的优势,推动人机一体化、思维传递、深度学习以及机器人控制等科学项目发展,是影响社会智能化生产的关键因素。文章分析人工智能在计算机网络技术中的应用领域,并以专家系统为例探究人工智能在计算机网络技术中的运用价值和意义。 相似文献
6.
7.
AlphaGo程序利用深度学习算法和蒙特卡洛树搜索算法在围棋领域取得了突破性进展,用定量分析技术实现了围棋这一传统定性式的任务.此次突破,实现了对定性人工智能的定量研究,这对人工智能体的研究具有重要借鉴意义.对于人工智能体而言,执行任务前需要考虑任务的可完成性,对下棋任务而言,任务目标是取得胜利,因此,本文先从任务可完成性角度出发,分别从特征完备性、表征空间构建及基于表征空间的搜索角度分析AlphaGo程序.其次,人工智能体在任务完成过程中,不可避免地受到各种扰动的影响,对AlphaGo而言,本质是对人下棋过程的建模,因此,本文从抗干扰的角度出发,分析了AlphaGo的缺陷.再者,人工智能的研究是人类用科学技术的方式模拟大脑活动的过程.AlphaGo所体现出的围棋思想与人类棋手的围棋美学之间的差异,也是定量分析与定性描述之间的差异.因此,本文从美感评价角度对AlphaGo进行了分析和展望.通过上述三个角度,本文诠释了AlphaGo程序所包含的原理以及对定量化分析定性人工智能体研究的借鉴意义.本文认为,AlphaGo虽然取得了里程碑式的进展,但在定性描述(如:美学,艺术)以及系统未知扰动方面仍存在大量问题值得研究.人工智能的跨越式发展,即从Alpha级别提升至Beta级别,应该包含对事物定性分析的能力.最后,希望人工智能算法的研究工作者通过本文能更关注于挖掘定性描述与定量分析之间的关联,并进一步将人工智能算法提升至BetaGo乃至更高. 相似文献
8.
人工智能研究的新前线:生成式对抗网络 总被引:8,自引:0,他引:8
生成式对抗网络(Generative adversarial networks,GAN)是当前人工智能学界最为重要的研究热点之一.其突出的生成能力不仅可用于生成各类图像和自然语言数据,还启发和推动了各类半监督学习和无监督学习任务的发展.本文概括了GAN的基本思想,并对近年来相关的理论与应用研究进行了梳理,总结了GAN常见的网络结构与训练方法,博弈形式,集成方法,并对一些应用场景进行了介绍.在此基础上,本文对GAN发展的内在逻辑进行了归纳总结. 相似文献
9.
赵勇进 《自动化技术与应用》2024,(1):84-87
为了解决目前就业推荐方法资源覆盖率低的问题,设计一种基于人工智能技术的智媒体就业推荐平台。通过人工智能技术设计智媒体就业推荐平台的整体框架,包括基础数据模块、用户界面模块、后台管理模块及个性化推荐模块,并设计学生和管理者在智媒体就业推荐平台中的业务流程。采用基于就业意向的个性化推荐算法,在智媒体就业推荐平台中为用户推荐就业资源,完成智媒体就业推荐平台的构建。实验结果表明,该平台运行时间随着请求数量的增加缓慢上升,抗压性较好,资源覆盖率均高于80%。 相似文献
10.
11.
潘丽莎 《自动化与仪器仪表》2023,(5):245-248
为了实现学前教育机器人对话系统的优化,以语音增强为切入点,提出一种基于双阶段注意力机制的儿童语音增强方法,以优化学前教育机器人对话系统,使机器人能够更准确地理解和执行学前儿童语音中的文本指令。首先分析了主流语音增强方法的基本原理以及单通道时域语音增强存在的问题;然后搭建双阶段注意力增强网络的语音增强方法,并在学前教育机器人对话系统中加入双阶段注意力语音增强模块进行测试。结果表明:双阶段注意力语音增强方法的SSNR得分相比于得分较高的通道注意力增强网络提高了3.3 dB,loss值是四种模型中最低的即0.98,且语音增强时域波形图清晰;综上研究得出,提出的语音增强方法具有可行性和有效性。 相似文献
12.
13.
14.
深度学习被广泛应用于自然语言处理、计算机视觉和无人驾驶等领域,引领了新一轮的人工智能浪潮。然而,深度学习也被用于构建对国家安全、社会稳定和个人隐私等造成潜在威胁的技术,如近期在世界范围内引起广泛关注的深度伪造技术能够生成逼真的虚假图像及音视频内容。本文介绍了深度伪造的背景及深度伪造内容生成原理,概述和分析了针对不同类型伪造内容(图像、视频、音频等)的检测方法和数据集,最后展望了深度伪造检测和防御未来的研究方向和面临的挑战。 相似文献
15.
16.
随着深度学习技术的飞速发展,以Deepfakes为代表的深度伪造技术开始充斥在互联网上的各个角落。Deepfakes借助于生成对抗网络和自动编码器技术,能够轻松替换人脸以及篡改人的表情信息。此类Deepfakes假视频可以制作虚假色情影片、谣言,传播假新闻,甚至影响政治选举,带来的社会影响极其恶劣。然而,针对此类伪造视频的检测技术还远远落后于生成技术,已有的工作都存在一定的局限性,并不能较好地对Deepfakes视频进行检测。本文首先对现有生成和检测工作进行综述,并分析了现有工作的缺陷,然后提出了基于EfficientNet的双流网络检测框架。通过在大规模开源数据集FaceForensics++测试,我们的检测技术可以在检测Deepfakes类假视频上平均准确率达到99%以上,并一定程度提高模型对抗压缩的能力。 相似文献
17.
赵巍 《电脑编程技巧与维护》2023,(4):125-126+161
针对大量的图像文字检测识别统计工作,依靠人工读取数据处理效率不高,且很难在短时间内完成,在数据时效性及实时性方面无法满足实际统计工作的要求。因此,基于人工智能技术设计的光学字符识别(OCR)检测和识别方案,通过对图像文字进行图文增强处理,能较好地进行图像文字识别,对识别结果及时进行统计汇总,大幅缩短了统计时间,提高了图像文字识别的智能化处理能力。 相似文献
18.
股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题。强化学习是解决该类问题的有效途径之一。提出了基于深度强化学习的智能股市操盘手模型ISTG(Intelligent Stock Trader and Gym),融合历史行情数据、技术指标、宏观经济指标等多数据类型,分析评判标准和优秀控制策略,加工长周期数据,实现可增量扩展不同类型数据的复盘模型,自动计算回报标签,训练智能操盘手,并提出直接利用行情数据计算单步确定性动作值的方法。采用中国股市1400多支的有10年以上数据的股票进行多种对比实验,ISTG的总体收益达到13%,优于买入持有总体−7%的表现。 相似文献
19.
20.
近年来,聊天机器人在网络和移动设备上的应用增多,在日常生活中常见,并给人们生活带来便利.人工智能会话技术变得越来越重要,这使人和计算机之间的交互变得简单.并有着巨大的商业价值.但是,一些聊天机器人交互被认为并非智能.这样的问题并没有减慢聊天机器人在市场上的快速出现,相同的错误却总是在一次一次的重复.利用深度学习技术来开... 相似文献