Archives 七月 2019

[免费试读] 那些让 iPad 更好用的新功能:Apple Pencil & 随航

编注:在今年的 WWDC 苹果公布了全新的 iPadOS 系统,在 iOS 功能基础上加入了很多 iPad 专属功能,这一变化也进一步扩展了 iPad 使用场景,我们也整理了一些关于 iPadOS 的重要变化,将陆续作为补充章节更新到本书中。


自 2015 年发布 iPad Pro 系列开始,苹果就有意将 iPad 打造成一款生产力工具,但过去的几年里,iPad 的最大诟病一直是软件层面上停留在对 iOS 的简单改进,始终未能改变大众群体视其为「放大款 iPhone」的看法。

而今年,苹果终于针对 iPad 发布了一个全新的系统平台——iPadOS。它基于 iOS 13 改造,针对 iPad 的特性加入了大量的改进和升级,让「生产力」得到显著提升。本章节将为你总结 iPadOS 在 Apple Pencil 使用方面的新功能和改进,以及能够将 iPad 作为 Mac 扩展屏幕的全新功能「随航」。

全新工具调板和新的标注工具

在对截图以及对照片 App 中的图片进行标注处理时,iPadOS 提供了全新的工具调板。拟物化设计的铅笔、荧光笔和橡皮等,让这些工具更具辨识度。笔尖尺寸以小数字方式显示,色彩描边则直接体现在笔身。

当你在标注的时候,标注区域的右上角还提供了透明度滑动条,我们可以根据需要调整图片的透明度。

工具调板还新增了标尺工具,我们可以利用它轻松地在图片中绘制直线。改进的橡皮擦增加了「像素橡皮擦」选项,我们能够以间断的方式擦除标注中的手写内容。

这一工具调板还可以被随意拖动到屏幕四周,或自动缩小在屏幕角落显示,以腾出更多空间来显示内容。

右下角滑动截图

在 iPadOS 中,截图操作有了新方式。我们可以利用 Apple Pencil 轻触 iPad 右下角后不要松开,并往屏幕中心移动,即可完成截取屏幕的操作。截图完成后,iPadOS 还会自动弹出标注工具,方便我们立即对图片进行标注和修饰。

整页屏幕快照

在 iPadOS 中,对文稿、电子邮件或网页等长页面进行截图时,我们可以选择将其以整页方式截取,并保存为 PDF 文稿。当我们截屏后,在截图编辑页面顶部选择「整页」,整个页面就会自动无缝拼接起来,点击「完成」就能将 PDF 文件保存到「文件」中。

随航:扩展和镜像桌面

作为 iPadOS 相当亮眼的新特性,随航可以把 iPad 变身为 Mac 的第二屏幕,一边处理工作一边实时演示。我们可以利用线缆或 Wi-Fi 两种模式,把 Mac 显示空间扩展到 iPad 上,使用起来与传统的投屏功能体验完全一致。在使用随航功能时,显示分辨率与 iPad 屏幕的显示效果无异,并且实时响应没有明显延迟。

想要利用 iPad 扩展和镜像 macOS 桌面,我们有三种方式可以进行操作。

首先,我们可以在「系统偏好设置 – 随航」中选择 iPad 设备。在这里,我们还可以设置 Mac 边栏和触控栏位置。其中边栏会显示键盘以及必要的修饰键,触控栏即 Touch Bar。

第二种方式,我们可以在 macOS 菜单栏的「隔空投放」中选择「连接到 iPad」。

最后一种方式,是在具体某个应用的菜单栏「窗口」中选择「移到 iPad」,可以把应用窗口快速发送到 iPad 并全屏显示。

随航也支持 iPadOS 中的编辑手势:三指左右滑动可以撤销和反撤销,三指捏放实现复制粘贴操作。在输入法方面,随航还支持 iPad 上安装的第三方输入法。

标记和速绘都可以连续互通

有别于其他「隔空播放」的显示器,把 iPad 作为 Mac 的第二屏幕时支持交互输入,鼠标可以在 iPad 上使用,Apple Pencil 也还可作为输入设备进行绘图、手写等操作,不过该功能需要应用适配支持,否则 Apple Pencil 只能充当鼠标实现点按操作。 连续互通功能和 Sidecar 的结合,使得我们可以在撰写 Pages、Numbers 等文稿时,直接调用 iPad 作为速绘设备,并利用 Apple Pencil 进行书写或绘图。


知乎也没什么办法

知乎终于上线了视频直播功能,毫无疑问,这依旧是知乎探索商业化的一次尝试。

在2010年成立,马上就要迈进10周年的知乎,依旧缺乏自行造血的能力,找不准可规模化且可持续的盈利模式。

这几年它上线了不少新功能,推出了几款新产品,在商业化道路上不断做尝试,但周而复始,它开始新项目,又关闭,开始新计划,又沉寂,最后只能靠接受外部融资来给自己争取继续尝试的时间。

知乎的诞生赶上了好时机。2010年的互联网,还在信奉“只要有流量,就能摸索出商业模式”。创业者也好,投资者也好,不考虑产品怎么赚钱,只觉得产品有流量有用户,赚钱的方式就会自然而然地出现。当市场冷静下来后,找不到盈利模式的产品们,幸运者卖身给了巨头,不幸运者悄然退出历史舞台。

知乎尚属幸运。它依旧是中文互联网里“严肃、认真且优质的内容”的代名词,还有人需要它,还能为它争取到试错时间。8月12日,知乎宣布接受了由快手领投、百度跟投的4.34亿美元F轮融资。

但此时的知乎要找到正确路径,实在太难了。

根据知乎官方数据,截至2019年1月,知乎已拥有超过2.2亿用户,共产出1.3亿个回答。这艘大船上已经有这么多人了,这个时候找正确航线,每掉一次头都是巨大的自我消耗。

知乎的自我尝试

知乎做了不少商业化尝试。

2016年4月,知乎上线Html5“值乎”,成功引发话题,刷屏微信朋友圈,但知乎没有发现这样的付费问答是条路,仅仅把它当做是一次品牌营销的游戏。

一个月后,由“在行”孵化的“分答”正式上线,直接复用了值乎的模式。这时候,值乎才急急忙忙在App中加入了值乎入口。似乎从这时就可以看出来,知乎在商业上的后知后觉。

同年11月份,公司上线“知乎Live”,正式开始一系列围绕知识变现的商业化尝试。

根据官方数据,截至2019年9月,知乎已经提供了28000个知识服务产品,8000+盐选专栏和Live讲座、超过20000本盐选电子书。虽然沉淀下不少作品,但收益皆不如预期,如今知乎的主要盈利还是以广告收入为主。

知乎在2017年组建过视频项目,在长达一年的测试后,因数据不达标而结束。2018年12月,上线了“即影”,主攻短视频市场,它跟快手、抖音一样,想让用户“记录生活日常”,但市场早已不留机会。随着“男性经济”成为热点,2019年2月,知乎推出“CHAO”,这是一款为男性种草的导购类社区产品。即使“炒鞋”、“男性种草”、“男性穿搭”等市场正在崛起,CHAO依然悄无声息。

CHAO
CHAO

2019年3月,知乎推出会员服务体系“盐选会员”,尝试会员体系。

在今年8月公布融资信息后,知乎宣布公开招募MCN机构。这个计划更是令人诧异,这意味着知乎要主动拥抱广告,甚至让“知乎大V”们发广告。但在过去几年,知乎为了社区文化,封杀了一批发软文的大V账号,甚至引发了一轮用户流失。

谁都不愿意打脸,要是有更好的办法,谁又想要兜兜转转回到自己曾经拒绝的道路上呢?很明显,知乎也没有什么办法。

知乎加入联盟

知乎除了继续融资,别无选择,但融资是接收弹药,也是选择站队。知乎创始人周源自然也明白这个道理,在接下来自快手和百度的投资后,知乎将成为腾讯、快手,和百度这几家的枪,瞄准字节跳动。

腾讯早在2015年就作为C轮融资的领投方参投了知乎,并且一路跟投到了E轮,它跟字节跳动之间,有“微视-抖音”一战,而快手更是抖音的正面敌人。

百度需要知乎,因为它需要用知乎来补充内容。搜索引擎依旧是大部分人获取信息的渠道,但在移动互联网的市场下,每个App都是相互独立的,有各自沉淀的内容,产品之间内容是没有打通的。为了有内容可搜,百度和字节跳动都需要补充产品内的内容。

在还没过完的2019年里,百度已经在内容领域里进行了4笔公开投资,分别是果壳、知乎、七猫小说和凯叔讲故事。任何一家接住橄榄枝的公司都是在选择站队,知乎也做出了它的选择。

知乎的未来

接下来知乎要面对的问题不少。

接受巨头投资的知乎,其的中立性将面临进一步的质疑。当社区上出现对投资者不利的争论时,知乎作为被投方该如何处理,将会是对它公信力的考验。

其次,知乎沦为投资方的工具,它为搜狗提供问答内容,为百度提供内容,为快手短视频和内容衍生品提供渠道,知乎的工具属性得到了资方的重视,但与此同时进一步丧失独立发展的能力,商业化之路仍不明朗。

周源在宣布融资情况的内部信中写着:战略股东的支持,是对知乎过往的肯定,对未来的信任。但实际上,这几位投资者,他们关心的是如何围剿自己的对手字节跳动。知乎的未来,没人关心。


十年磨一剑,AI落地惊人,这样的“智能语义理解大脑”才够炫

WechatIMG72_meitu_1

【猎云网北京】10月12日报道(文/奇点)

在人机交互技术方面,目前业界仍在进行多方面的探索和尝试,在人机交互的技术分类中包括:基本交互技术、图形交互技术、语音交互技术及体感交互技术等。其中语音交互技术不仅在AI中是重中之重,在智能语音上也扮演者重要的角色。

目前智能语音在个人市场、行业领域的应用场景也得到了快速扩展,用户对相关语音产品使用时长及粘性也明显提升。其主要领域涵盖了教育、汽车、医疗、家居、客服、手机、个人语音助手等多个领域。

而个人语音助手被产业界视为潜在的用户流量入口,包括科技巨头、新兴厂商均全力布局于此,但就及整个智能语音技术来说,其自身也面临着难以突破的技术瓶颈:语义理解技术。

从语言的本质来讲,语言的开放性使得计算机难以准确理解人类语言所表达的真实意图,这也造成了相应的落地产品在应对需要逻辑驱动的功能层面表现较为乏力。

而在人机交互领域中,不乏许多以垂直领域和细分场景为突破口的后起之秀,据猎云网了解,深思考人工智能机器人科技有限公司(简称:深思考)便是其中一个值得借鉴的案例。

打造多模态语义理解大脑,将AI赋能多应用场景

深思考是一家专注于类脑人工智能与深度学习核心科技的AI公司,核心团队由来自中科院、清华的一线AI科学家与领域业务专家组成。

公司核心技术聚焦于“多模态深度语义理解与人机交互技术”,目前在中文语义理解、多轮人机交互和机器阅读理解方面均取得突破。

同时近日华为旗下的哈勃科技投资有限公司也向深思考“抛出绣球”,据天眼查显示:华为旗下哈勃科技投资有限公司投资了深思考。

华为.jpg

能够吸引到华为这种“大厂”的青睐,一方面,说明华为的人工智能生态正在逐步构建;另一方面,也说明深思考在人工智能的某一领域应该拥有着绝对核心竞争力。

就目前从整个AI产业界来看,最早实现产业化的是语音识别,接着是视觉、图像识别,最后才到语义理解,在语义理解技术中,同行的大部分友商基本还停留在单模态化——即图像、文本、语音不能同时兼顾的技术状态下。

而在这方面,深思考将全部的力量集聚在“多模态深度语义理解”上,此引擎技术可让机器能够同时理解文本、图像视觉等多模态非结构化数据背后的深度语义。

如果用负责表达和获取信息的眼耳口鼻来比喻“语音技术”,那么“语义技术”就相当于人的核心大脑。对于多模态深度语义理解技术,深思考将其视为传统语音、图像识别的进一步理解和融合。

在整个学术界乃至可预见的未来,语义理解技术都将以“多模态化”走下去,深思考此次也正是走在了语义理解发展的最前沿道路上。

一方面,深思考不断打磨多模态语义理解技术的多场景落地,整体战略布局紧扣人、车、家三大模块,研发了智慧医疗、智慧汽车、智慧生活、智能手机等解决方案,涉及从AI医疗到智能家居等多个应用场景。

据深思考创始人&CEO杨志明透露:“一个能让AI真正落地的场景,其实是贴近了我们的日常生活”。

事实上,若只用App去遥控开窗帘、关灯,这种传统的智能家居并未能解决人们的刚需,也并不是每一个家庭都需要一个智能音箱,家庭中真正需要的是一个虚拟的“中央语义理解大脑”。

传统的人机交互在对话体验感上是远远不够的,是因为这种简单的语音指令只能“听的见”,由于在语义理解上的缺失,还未能做到真正理解特定场景下用户的意图。但深思考通过多模态深度语义理解技术,在智能家居场景下,通过与用户进行“人性化的交互”,真正可以理解用户在家庭中的语义娱乐、生活健康、膳食营养等实际需要,这好比一个家庭中央的AI服务。

另一方面,深思考将深度语义理解技术应用于智慧医疗领域,开发iDeepWise.AI4.0宫颈癌辅助筛查系统,实现了大规模医疗筛查场景中AI的落地应用。

宫颈癌筛查的重点是在数量繁多、形态各异的细胞中识别出具有诊断意义的异常细胞,深思考通过“多模态深度语义理解”,综合分析单个细胞特征和细胞间的关联性,有效提升了异常细胞的识别准确率。

据猎云网了解,杨志明曾在“2019WISE超级进化者”大会上表示:“这就是语义理解,就是我能看懂这句话及这个图像背后的含义。

其次,他在汽车领域也打造了一个“智能场景”,为汽车配置了一个深度语义理解的大脑。推出了基于AI多模态深度语义理解引擎打造的智能交互机器人。将车内车外场景相融合,为用户提供一站式出行生活服务。

其中,AI多模态深度语义理解技术在车内应用有着四大特点:

1570876501999.jpg

1、AI引擎与RPA(机器人流程自动化)结合大大减少了用户在简单工作上消耗的时间,提升了车内人机交互体验。例如当AI通过场景理解,识别到用户正在上班途中,即可为主人自动播报工作安排,并实现自动预订会议室,会餐地点、机票酒店等安排。具体到订餐场景时,深思考的解决方案通过机器人自动调用餐厅的预订接口完成预定,避免了中间人工预订可能会产生的误解和麻烦,从而实现了一站式的服务。

2、车辆与智能家居信息融合同步。深思考通过车载系统与智能家居的链接,实现了对智能家居的远程控制,同时,在用户日程安排上,该公司的产品也能够通过语音进行提醒,并为用户提供适合的建议或决策。

3、关联意图的推荐和理解。对于出行过程中的场景,深思考的智能交互机器人会进行主动的识别与理解,并对下一个场景进行推测。当抵达某一地点时,AI会自动判断下一个目的地是停车场还是酒店等场景,并根据V2X的信息为用户进行智能导航和推荐。

4、车路协同、车车协同智能交互。对于行驶过程中前方的路况以及周围车辆的驾驶行为,深思考的解决方案也会进行实时的感知和理解。当前方发生交通事故,拥堵缓行或是周围车辆存在变道倾向时,AI会通过语音的方式对用户进行提醒,以防止意外的发生。

深思考在基于智能车联网的数字座舱场景下,通过车内摄像头和语音传感器,实现了多模态非结构化信息的深度语义,而且具备自由跨域上下文理解和多轮对话交互的能力。这相当于赋予了汽车一个智能语义理解的大脑,使得你的数字座舱会更加智能、更加懂你。

1570876527873.jpg

同时,多模态语义理解也可以用来赋能汽车的营销,它会将用户的对话信息、线上咨询等综合起来做多模态语义理解,最后再对用户进行建档、数据分析,以帮助汽车厂商扩大用户的流量入口,以便他们可以更好的去了解用户画像和利用AI帮助主机厂商提高销售转化率。

目前深思考已为奇瑞捷途提供技术支持,今年还将有几家大品牌厂商、及数千家4S店会应用到深思考的落地产品及解决方案。

人机交互“多轮多”,越交互越了解

在人机交互系统中,类似“siri”这种人机助手的交互形式大都以“单轮问答”——即一问一答模式进行。

但深思考在人机交互方面已经做到机器与人之间的“多轮问答”人机交互:意图的准确识别、上下文的精准理解、个性化特征的深入提取,从而在抓住用户真正意图的同时,实现多轮人机交互。

同时据猎云网深入了解,深思考在人机交互上最大的特点是能够实现“自由跨域”——即对用户的“大白话”进行意图理解,让机器更具人性化:根据不同用户的个性化特点,提供不同的交互流程。在这个过程中,不断的对“交互对象”进行了解,以达到“越交互越了解”的程度。

深思考独特的“自由跨域”技术实现离不开其团队研发的内核级技术——多轮对话管理引擎。这套引擎旨能够对“对话过程”进行监督、管理、追踪,通过模拟人的记忆方式,采用深度学习的一些算法模型去设计,确保机器的长短时记忆。

就算法来看,行业内很多做语义理解的友商还在用基于统计学的机器学习算法来做语义理解,深思考在这里已经是“长辈”了,目前深思考团队聚焦最为前沿的语义理解技术,诸如:BERT、XLNET、ALBERT,进行商业化落地。

目前深思考整个公司主要聚焦于ToB,就目前针对手机终端应用场景,与手机厂商做深度战略合作,未来也可能会利用这些场景在ToC端做一些探索。

杨志明说:“当下整个AI发展的现状就像一部不受青睐的电影:瞩目的导演拍出了一部巨作,但看的人往往寥寥无几。因为现在一个真正的AI公司,其核心团队往往来自学术界,而学术界几乎都发源于‘实验室’的场景下,这也会导致许多公司在初期不太注重产业化落地。”

而深思考则在创立之初就保持了技术投入和商业落地并驾齐驱的状态。

“十年磨一剑”,AI产业化未来可期

AI不同于其他行业,在一个团队中,“核心人才”是关键。深思考不仅具有精良的技术团队,同时具有强大的商业化基因和对应用场景的理解力

其核心团队主要来自于国内的核心AI发源地:内部成员由来自中科院自动化所、软件所、计算所、微电子所等中科院院所、清华大学及海外知名大学人工智能方向的一线AI科学家与领域业务专家组成,多人曾在AI领域内连续创业,在商业化产业落地的脚步上从未停止,这一路走来也收获了满满的经验。

团队的重心都一直是人工智能领域中一线前沿的科学家,且他们在深度语义理解、计算机视觉和深度学习处理器等方面拥有多项发明专利,具备深厚的技术积累。

杨志明表示:“实际上,我们在人工智能领域中已经深耕了十多年,包括此前多次的创业经历,这为我们积累了很多的场景化语料和数据,这使得我们的技术不断迭代进化,商业落地的考量也更加成熟。”

不可否认,杨志明和其团队历经十多年的技术沉淀,凭借“多模态深度语义理解与人机交互”技术,深思考的确构建起了坚固的技术壁垒,如今可谓是厚积薄发,十年磨一剑。

据猎云网从深思考侧面了解:在深思考成立之前,杨志明在AI路上已经历了三次创业,从第一次创业将AI与信息安全相结合的尝试到将AI用于法律垂直行业的第三次创业,中间还穿插了一部AI加广告推荐的插曲。

杨志明曾说:“多次的创业经历让我充分的意识到了技术必须要实现到具体产品的落地,所以一直也都在将技术积累和领域业务相结合去创业”。

直到2015年,杨志明的第四次创业——成立了深思考人工智能机器人有限公司,那时的AI刚在国内悄然兴起,可谓生正逢时。

从时间的长度及领域的宽度来讲,杨志明的创业经历从一定程度上横跨了国内AI的发展历程,这使得他更懂得如何将将AI规模化、产业化的实现落地。

AI在发展过程中一定是从感知到认知,亦或者是从感知到理解,随着5G、物联网的发展,无论是从落地还是技术、数据壁垒、算力布局上讲,深思考在人工智能领域的未来都值得令人期待。