公共场所人脸识别或全面被禁!/ “偷懒”上热搜!南京大三学生自制宿舍关灯神器火了 / 加州理工让只能行走的双足机器人「上了天」
发布于 2021-10-08 08:14
动态先览
1
公共场所人脸识别或全面被禁!刚刚
欧洲议会决议,AI监管再收紧
2
“偷懒”上热搜!南京大三学生自制宿
舍关灯神器火了,网友:希望量产
3
装上螺旋桨,加州理工让只能行走
的双足机器人「上了天」
4
多模态信息如何嵌入推荐系统?
RecSys2021《多模态推荐系统》教程
5
深度学习激活函数全面综述论文
6
硬核书《可解释机器学习》最新版,
打开黑盒之谜
7
PPLCNet:CPU端强悍担当,吊打现
有主流轻量型网络
8
港大&南科大提出端到端PDVC,用
DETR的方法做Dense Video Captioning!
9
ICCV2021 2D和3D通用!新医疗影像
自监督SOTA
新闻类
公共场所人脸识别或全面被禁!刚刚,欧洲议会决议,AI监管再收紧
刚刚,欧洲议会投票通过决议,呼吁全面禁止基于AI生物识别技术的大规模监控。
此次决议呼吁全面禁止在公共场所进行自动面部识别,并对警方使用AI进行预测性警务活动实施严格限制措施。欧洲议会以 377 票赞成、248 票反对、62 票弃权的结果通过了决议。
决议还呼吁禁止使用私人面部识别数据库,并表示基于行为数据的预测性警务活动也应该被取缔。
此外,决议还希望禁止试图根据公民的行为或个性,对公民的信用进行评分的社会评分系统。
传送门:
https://techcrunch.com/2021/10/06/european-parliament-backs-ban-on-remote-biometric-surveillance/
“偷懒”上热搜!南京大三学生自制宿舍关灯神器火了,网友:希望量产
宿舍关灯这件事情,最近比较火。
起因是一位南京信息工程大学大三学生,花了7、8天时间,自制了一款宿舍关灯神器。
效果是这样的。
整个过程很是丝滑了。
这波操作瞬间吸引了网友们的眼球,直呼“希望哪天可以量产”。
传送门:
https://weibo.com/7474091977/KBtFxEzqW?filter=hot&root_comment_id=0&type=comment
装上螺旋桨,加州理工让只能行走的双足机器人「上了天」,还玩起了障碍滑板、走绳索
有的机器人可以行走,有的可以飞行。你见过既能行走又能飞行的双足机器人吗?
加州理工学院的研究人员就打造了这样一台机器人 LEONARDO(LEgs ONboARD drOne 的简称,或简称 LEO),该机器人结合了行走和飞行,创造了一种新型的运动方式,使其异常灵活,能够进行复杂的运动。日前,该研究相关的论文登上了 Science Robotics 封面。
传送门:
https://www.science.org/doi/10.1126/scirobotics.abf8136
教程类
多模态信息如何嵌入推荐系统?RecSys2021《多模态推荐系统》教程
本教程的结构如下。在概述了偏好模型的重要家族之后,我们将讨论如何将多模态推荐系统与代表特定模态的模型(用户-项目偏好之外的辅助数据)结合起来设计。随后,我们深入研究三个主要的感兴趣的模态,即:文本、图像和图形,同时识别在每个模态下的相关算法。接下来是对跨模态使用的调研,包括应该依赖哪个模态,为一种模态设计的模型是否可以与另一种模态工作,以及为给定模态使用哪个模型。
传送门:
https://recsys.acm.org/recsys21/tutorials/#content-tab-1-1-tab
深度学习激活函数全面综述论文
近年来,神经网络在解决许多问题方面有了巨大的发展。不同类型的神经网络被引入来处理不同类型的问题。然而,任何神经网络的主要目标是将非线性可分的输入数据转换为更线性可分的抽象特征,使用层次结构。这些层是线性和非线性函数的组合。最流行和常见的非线性层是激活函数(AFs),如Logistic Sigmoid、Tanh、ReLU、ELU、Swish和Mish。本文对深度学习神经网络中的激活函数AFs进行了全面的综述和研究。不同类别的AFs,如Logistic Sigmoid和基于Tanh,基于ReLU,基于ELU,和基于Learning。指出了AFs的输出范围、单调性和平滑性等特点。并对18种最先进的AFs在不同网络上的性能进行了比较。本文提出了AFs的见解,以帮助研究者进行进一步的研究,并帮助实践者在不同的选择中进行选择。用于实验比较的代码。
传送门:
https://www.semanticscholar.org/paper/A-Comprehensive-Survey-and-Performance-Analysis-of-Dubey-Singh/0c3e62c269d19ac8e7196a18f9b07f4a2d54b951
硬核书《可解释机器学习》最新版,打开黑盒之谜
机器学习模型经常被批评是技术黑箱:只要输入数据就能得到正确答案,但却无法对其进行解释。Christoph Molnar在其新书中呼吁大家当前是时候停止将机器学习模型视为黑盒子,在学会运用模型的同时更应去学会分析模型如何做出决策,并给出了将黑盒变得具有可解释性的讨论。
传送门:
https://originalstatic.aminer.cn/misc/pdf/Molnar-interpretable-machine-learning_compressed.pdf
程序员
PPLCNet:CPU端强悍担当,吊打现有主流轻量型网络,百度提出CPU端的最强轻量型架构
本文提出一种基于MKLDNN加速的轻量CPU模型PP-LCNet,它在多个任务上改善了轻量型模型的性能。本文列举了一些可以提升模型精度且保持延迟几乎不变的技术,基于这些改进,所提PP-LCNet可以凭借同等推理速度大幅超过其他已有网络。
如下图所示,在图像分类任务方面,所提PP-LCNet在推理延迟-精度均衡方面大幅优于ShuffleNetV2、MobileNetV2、MobileNetV3以及GhostNet;在其他下游任务(如目标检测、语义分割等),所提方案同样表现优异。
论文地址:
https://arxiv.org/pdf/2109.15099.pdf
GitHub 地址:
https://github.com/PaddlePaddle/PaddleClas
港大&南科大提出端到端PDVC,用DETR的方法做Dense Video Captioning!
密集视频字幕(Dense Video Captioning)的目的是从视频中生成多个与其时间位置相关的字幕。以前的方法遵循一个复杂的“先定位再描述(localize-then-describe) ”的方案,严重依赖于许多手工设计的组件。
在本文中,作者提出了一个简单而有效的端到端密集视频字幕(PDVC)框架 ,通过将密集字幕生成定义为一个集合预测任务(类似DETR)。在实现中,PDVC通过将事件计数器叠加在Transformer解码器的顶部,在对视频内容的整体理解下,精确地将视频分割成多个事件片段,从而有效地提高了预测字幕的连贯性和可读性。
论文地址:
https://arxiv.org/abs/2108.07781
GitHub 地址:
https://github.com/ttengwang/pdvc
ICCV2021 2D和3D通用!新医疗影像自监督SOTA
提出一种新的自监督方法(Preservational Contrastive Representation Learning, PCRL),其主要思想是通过结合基于contrastive的方法和predictive的方法取得更好的自监督性能。并且,PCRL通过重建多样的上下文(diverse contexts),使得学习到的特征表示(representation)能够保留更多的信息。当在进行小数据集上进行微调的时候,这些保留的信息可以发挥更大的作用。
论文地址:
https://arxiv.org/abs/2109.04379
GitHub 地址::
https://github.com/Luchixiang/PCRL
昨日推荐
烧钱明星Deepmind终于赚钱了,首次盈利5960万美元!/ 美国拉拢欧盟联手遏制中国 / 2021年物理诺奖:不只是理论创新
清瞳时代,用科技让复杂的世界更简单
本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。
相关素材