讲师自我介绍和课程安排
对于那些还没有当面见过我的同学们(我相信你们在第一学期已经看过视频了),我是Joana 。我在国王学院(Kings)教授数字方法(digital methods)。今天在第二部分,我的同事 Erik 将会加入我们。
今天的课程分为两个部分:
- 第一部分是关于数字方法的讲座
- 第二部分是埃里克的启蒙讲座
这样安排的目的是让你们能够认识可能以前没见过或没有上过他们课的教职员工,也许你们可以了解他们的研究领域,之后可以请他们做导师。
第一部分课程规划
我将第一个小时分成两部分:
- 首先,我会提供一个广泛的定义,解释我们所说的数字方法是什么。可能会与其他方法学派进行比较,并使用一些概念或术语,如”媒介密度”(medium density)和”重新利用”(repurposing),帮助你们理解构成这些方法的程序步骤。
- 然后我会举出四个例子,展示这些方法基于理论和实践原则的潜力。我会尽最大努力来讲解,因为在一个小时内介绍这些方法确实是个挑战。
- 我还准备了一些公开可用的资源,包括教程、方法和工作坊材料。如果你们感兴趣,可以自行访问这些资源来学习这些方法,特别是如果你们没有机会参加部门提供的数字方法模块课程的话。
- 最后我们会有问答环节。
希望你们能喜欢今天的内容,请继续关注。
推荐阅读材料
我有两篇推荐阅读材料,我来解释一下为什么选择这些:
- 第一篇是一个采访。这篇文章的阅读体验非常流畅,很容易理解这些方法的精髓。这是对理查德·罗杰斯(Richard Rogers)教授的采访,他在十多年前提出了这些方法。
- 第二篇是一个较短的百科条目,关于媒介密度(medium density)的概念化。这更偏理论,但只有通过实践才能具体化和实现。
如果你们没有时间读这两篇,我建议先读采访那篇。我相信你们会对这些方法有很好的认识。
学习目标
这是第一部分(第一个小时)的三个主要学习成果:
- 从实践和理论角度理解这些方法,以及”重新利用”(repurposing)和”媒介密度”(medium density)这些构成方法的核念。
- 能够识别我分享的这些公开可用资源,以便之后可能在你们的论文中使用。
- 希望我在讲座第二部分带来的四个例子能够启发你们的实证研究或基于项目的论文。
数字方法的定义与特点
我们讨论的是什么方法?这是一个广泛的定义:
这些方法是关于网络(web)、网络数据、技术以及使用文化和亚文化的研究发现,但不是以工具性的方式。
让我解释为什么不是工具性的方式:因为媒介、算法、平台、软件和数字对象所动员的知识被认真对待。这意味着,一个工具性的方法可能会忽视在收集网络数据时必须考虑的底层算法、平台动态、数据如何塑造用户行为或审核政策等因素。
这里的”媒介”(medium)概念涵盖但超出了我们理解的通信平台范围,在我的幻灯片中用绿色突出显示:
- 主导平台(dominant platforms)
- 网络技术(web technologies)
- 数字对象(digital objects)
- 研究软件(research software)
这些都被视为媒介。这意味着这些方法理解计算媒介如何整合到研究方法中,整合到你如何在网络环境中设计项目。
这种思维框架正是将数字方法与媒介的工具性使用区分开来的关键。我们思考我们的研究主题——可以是政治、营销相关问题、偏见等。
研究主题举例
[讲师询问学生]
“给我一个研究主题。一个研究对象。一个主题?”
“你能说大声点吗?”
“是的。”
“标签还是数字?还有什么?”
“谢谢。标签。还有什么?”
“女权主义。”
你看,你思考你的研究主题和主题时,要将它们与计算媒介一起考虑。这就是这种方法的理念。
方法的程序步骤
以下是方法的程序步骤:
- 首先,你制作关键词列表或数字对象列表,这些将帮助你通过网络访问数据
- 然后是数据集策划和构建过程
- 接着使用数据可视化,这里不是作为最终产品,而是作为提出新问题和展示主要发现的手段
让我用这个例子来简要说明:
案例研究:巴西抗议活动
研究主题是2016年巴西人民支持和反对总统迪尔玛·罗塞夫(Dilma Rousseff)弹劾的抗议活动。
当时,Instagram不是政治平台。这里有人以前用过Twitter吗?我可以告诉你们,在2016年,Twitter是政治参与的环境,而不是Instagram。
所以你看,这里有重新利用(repurposing)一个基于美学的平台来研究政治参与的想法。这项研究列出了支持弹劾和反对弹劾的标签(hashtags)。巴西当时因为弹劾发生了几次抗议活动,她最终被弹劾。
研究者们考虑了平台机制和使用文化,因为有时你知道如何从网络获取数据,但忘记考虑平台的使用文化。所以我们要考虑哪些标签被采用和使用来代表支持和反对的立场。
技术实现过程
为此,你还需要使用工具和研究软件来访问数据:
- 有了这个列表后,你可以使用API来请求和检索数据
- 你需要了解这个API的限制和潜力
- 可能需要使用研究软件来帮助你,比如Python脚本
- 这又是另一种技术中介来处理数据
我们都使用软件或笔记本电脑。在这个案例中,一个例子是使用网络可视化软件。如果你要可视化网络,你也需要算法来塑造你的网络。
当你展示发现时,这是一个累积过程,因为你要考虑研究主题(抗议活动)并绘制人们如何参与的图谱。但在方法的每一步中都有计算媒介的作用。你有这些技术中介的层次,在数字方法中,我们重视这些并用它们来帮助我们反思和分析数据。
数字方法的特点
因此,在数字方法中:
- 在方法的每一步都不可避免地要与软件和AI平台打交道
- 有重新利用主导平台和机制来研究数字媒体、数字文化的理论实践基础
- 要记住我之前说的,2016年Instagram从未被认为是研究政治的地方,但现在可能是了
- 这涉及使用为一个目的创建的平台,但你在重新利用它
- 这个项目提出研究问题,设计方法时要考虑Instagram本身、数字对象(标签和图像)以及实施方法所需的计算媒介
案例分析细节
因为特别注意媒介,让我们看网络解释的这个例子:
这个网络的形状对熟悉网络分析的人来说……这里有人熟悉网络吗?没有?
那让我告诉你们:这个网络的形状显示了位置的一致性,因为节点都靠近一个特定的标签。那个标签是反对弹劾的巴西人使用的,主标签用英语写成”won’t be a coup”,因为对他们来说这是一次政变。
想象我们在做这个项目时,我们可视化这个网络,然后可能会说:”算了,我们不需要分析这个网络,因为有一致性。”然而,因为了解Instagram的使用文化,我们知道Instagram用户可以重新利用标签。
社交媒体分析深入探讨
我们知道在Instagram和其他社交媒体平台上存在所谓的自动化市场(automation market),你可以自动创建帖子,列出标签来参与和创建内容,也许会走向内容操纵或影响人们在信息流中看到的内容。你们明白我的意思吗?我们都知道这一点,对吧?
因此,我们不再关注网络的形状,而是描述和检测到黄色标签恰恰是反对弹劾的人重新利用主标签并产生大量自动化内容来传播这种观点和立场。
你们跟上了吗?这就是我用这个例子试图说明为什么特别关注计算媒介很重要。
数字方法的定义与区别
数字方法带着这种理解,而不是:
- 将现有方法迁移到线上
- 仅仅是处理数据
- 关于大数据
- 掌握现成的数据包
- 开发代码或开发软件
这是一个更精确的定义,它考虑到了我的介绍:数字方法是一种特殊形式的研究实践,它关键地位于它所探索和利用的技术环境(网络)中。
与其他方法学派的比较
为了更好地理解这些方法,我想强调它们与其他方法学派的区别,但这只是一个粗略的比较。如果你熟悉这些其他的方法学派,请原谅我的简化。
这些方法是由阿姆斯特丹大学的理查德·罗杰斯(Richard Rogers)教授在2009年提出的。它被认为是一个术语、研究实践和领域,后来在2013年的《数字方法》(Digital Methods)一书中得到确立。它的理论背景包括:
- 科学技术研究(science and technology studies)
- 软件研究(software studies)
- 传播设计研究(communication design
数字方法的主要特征
我想和大家分享三个关键点,这些是数字方法的核心特征:
- 对媒介特异性(medium specificity)、媒介动态(medium dynamics)和媒介密度(medium density)的特别关注
- 以原生数字内容(natively digital)为工作对象的前提
- 基于网络环境进行研究发现
如果有人说”我的研究与网络环境无关,我没有使用原生数字对象”,那么也许这种方法不适合你。如果你无法将研究发现建立在网络和原生数字内容的基础上,也许你应该使用其他方法。这说得通吗?
我认为这三个原则正是将数字方法与其他方法学派区分开来的关键。我只是拿这两个进行比较:文化分析(cultural analytics)导向的方法和计算方法(computational methods)。这两种方法也都出现在2009年。
方法比较的关键点
为了总结这个粗略的比较,我有两个要点:数据类型和规模(data type and size)以及媒介的角色(role of the medium)。
我们教室里有一位在计算方法方面有出色背景的同事埃里克(Eric)。这是一个粗略的比较,目的是帮助我们理解我所讲的方法的范围。
数据特征比较
计算方法和文化分析都关注大数据(big data):
- 文化分析关注文化数据
- 计算方法关注人类行为数据
而数字方法则基于情境化和网络化的数据(situated and networked data),不一定是大数据。这对于数字人文、社会研究或其他可能不想处理大数据但想用数据工作的领域来说是很好的。研究发现需要考虑在线环境。
媒介角色比较
在媒介方面的差异:
- 文化分析的媒介包括:
- 电影
- 卡通
- 动态图像
- 摄影
- 视频游戏
特别是关注视觉媒介
- 计算方法中:
- 计算机基础元素
- 计算机模型
- 算法技术
这些在方法应用中具有很高的重要性
- 数字方法中的媒介是:
- 网络环境
- 平台机制
- 方法
- 数字对象(如URL、标签、图像)
- 研究过程中使用的研究软件
数字方法的研究理念
想要在项目中使用数字方法的研究者们遵循这样的理念:
- 跟随媒介
- 捕捉媒介的动态
- 对社会做出基础性论断
换句话说,你的研究主题与你对媒介的理解以及媒介如何塑造和重塑你的研究主题并赋予其意义是紧密结合的。
你们跟上了吗?是的,我快要结束这个定义部分,准备进入示例部分了。
理论和实践基础
我列出了一些理论和实践基础,虽然不会详细讲解,但我认为你们应该知道只有五个要点,我之前提到过其中一些:
如果你开发数字方法项目,你需要:
- 使用原生数字内容
- 可以重新利用主导平台和在线数据
- 考虑媒介技术(即媒介概念、实践和语言)
- 使用数据可视化作为提出新问题和理解数据的手段,而不仅仅是最终产品
- 在解释数据时采用定性定量方法
数字方法实践者与重要著作
这里有一些在开发数字方法的人员的例子,包括我们系里的老师:
- 之前提到的理查德·伯格斯(Richard Burgess)教授
- 诺丹·马斯(Northern Mars),她是华威大学(Warwick University)的数字社会学教授。她关于数字社会学的这本书非常好,采用了数字方法的原则
- 关于假新闻(fake news)的实地指南,这是研究错误信息和假新闻的重要出版物,由我们系的莉莉安娜·鲁克斯(Liliana Roux)高级讲师和乔纳森·格雷(Jonathan Grey)读者(研究员)组织编写
- 还有其他例子,我就不一一详细介绍了,但你们有幻灯片可以之后自己探索
到目前为止都明白吗?很好,我们时间掌控得不错。
实例讲解部分
现在我们进入第二部分,看一些例子。也许你们能对这些方法有更多实际的认识。
互动调查
我有一个问题要问你们:你们熟悉涉及排名系统(ranking systems)、在线图像集合(online image collections)、网络实体(web entities)、社交媒体自动化市场(social media automation market)、人工智能偏见(AI bias)的数字方法项目吗?
可能的回答选项是:
- 当然了,我很熟悉
- 熟悉列出选项中的一到两个
- 不熟悉,但我很想了解
- 不熟悉,暂时没有其他评论
[调查结果讨论]
我们有少数人表示熟悉,也许是参加过数字硕士模块的学生。我们大多数人不熟悉,但这没关系,因为这个方法学派还很年轻。就像计算方法(比如说计算社会科学)和文化分析方法一样,都是2009年才诞生的,它们都还在建立过程中。所以不了解也没关系,感谢大家参与。
四个实例分析
我有四个例子要展示。在展示过程中,我想关注这个问题:考虑计算媒介和数字对象本身有什么特别的生产性?我会简要展示一些样本,希望你们注意这种对计算媒介和数字对象的特别关注,以及为什么这对开发项目很有帮助。
第一个例子:重新利用搜索引擎的顶部结果
这个例子是关于谷歌(Google)的。我们可以通过查看谷歌搜索结果以及查询其排名系统来研究社会关注点或趋势。
搜索引擎有着各种算法技术来帮助引擎生成结果并返回我们特别搜索的内容。如果你认为顶部结果是被程序设计来给我们提供可以信任的高质量页面,那么默认情况下:
- 如果你在这里,你会得到英语语言和英国域名的结果
- 如果你在葡萄牙,你会得到葡萄牙语和葡萄牙域名的结果
罗杰斯说,如果我们预先知道这个媒介的一些特点,我们就可以问:返回了什么类型的来源?谁在与这些来源互动?现在我们还有生成式AI(generative AI),有时当你向谷歌或其他引擎提问时,你会得到这种生成AI的提示。这意味着人们可以通过分析图像和来源来理解谷歌对地方的感知,揭示社会趋势。
图像分析示例
这里有一个在疫情期间使用标签#Covid art的例子。通过这种方式,你可以捕捉历史时刻,捕捉趋势,或者如罗杰斯所说,捕捉社会关注点,这正是因为结果在本地域名和语言方面的特殊性。你可以看到疫情期间的图像网格,以及与这个特定标签相关的排名,还有一个可视化展示,分析与之相关的参与者。
第二个例子:重新利用网络实体、知识图谱和视觉AI处理图像
这里有人对研究图像感兴趣吗?或者以前研究过图像吗?
[看到1-2人举手]
如果你以前从未做过这方面的研究,也许你可以从这个例子获得灵感,学习如何在上下文中研究在线图像集合,而不是仅仅依赖机器学习有限的分类法,这种分类法中往往缺乏社会网络知识。
现在有一个国际性的方法论趋势,源自文化分析方法学派,就是将图像作为集合来研究。如果你使用网络实体,这些是例子,你可以理解图像的上下文背景。
什么是网络实体?
网络实体(web entity)是现实世界对象或概念的数字表示,可以是:
- 人
- 地点
- 组织
这些实体被用来帮助搜索引擎提供更相关的搜索结果。
这里我们看到一个重新利用的例子。这些实体不是为研究而设计的。我们看到一个迷因(meme),网络实体不会告诉你图像中有什么,而是告诉你上下文。它告诉你这是一个网络迷因,可能来自4chan,具有幽默性质,这是因为图像的内容和上下文。
如果你考虑机器学习输出,你会得到不同的结果,比如”卡通青蛙”、”迷因”、”绿色”、”微笑”。这些不是上下文性的。而通过网络实体,你看到的是来自网络源的网络知识、语义和上下文。
知识图谱示例
例如,谷歌将这些来源组织在知识图谱(knowledge graphs)中。这是一个知识图谱的例子。我不想在这些技术部分深入太多,但我只是从媒介角度开始,让我们理解重新利用的理念。
你可以使用谷歌的视觉AI从图像集合中检索网络实体。这是另一个例子,是关于一个迷因的。这是一项关于新冠疫情迷因的研究。你可以看到第一个实体和其他实体都是上下文性的,你可以看到与迷因相关的冠状病毒疾病和大流行等实体,这些提供了图像的上下文。
深度换脸研究案例
例如,这项研究的一个成果是理解色情网站在谷歌与深度换脸(deepfakes)相关的搜索结果中的消失过程。他们在用谷歌结果绘制深度换脸的图谱。这是一个短视频,显示了X视频和色情网站实体以及随时间推移的网络。
你可以看到在2017年左右,与深度换脸相关的输出和相关参与者(如这些色情网站)的数量,随着时间推移和平台审核政策的作用,这类内容从可见网络中消失了。
ChatGPT辩论研究
另一个项目是关于映射和合并辩论的,这与ChatGPT有关。这是在ChatGPT发布八个月后进行的研究。因为你有来自网络的图像集合,然后使用网络实体,你可以理解当时辩论背后的上下文,包括参与者和相关图像,其中包括教育集群和数学集群,以及当时
第三个例子:社交媒体自动化市场研究
通过主导服务研究机器人操作和功能,可以帮助我们理解:
- 参与度(participation)
- 算法治理(algorithmic governance)
- 注意力经济(attention economy)
- 以及其他我没有列出的方面
这些是一些网络服务,你可以通过它们实现自动化或提升你的社交媒体表现,简单来说就是通过:
- 购买参与度
- 购买关注者
- 购买点赞
- 自动创建帖子
这些都是你在可见网络中能找到的服务的例子。这是暗网的截图,你也可以通过暗网获得关注者、点赞、评论并实现自动化。
再次强调重新利用(repurposing)的理念:这些服务是为特定市场而创建的,但你可以重新利用它们来理解机器人(bots)。这是另一个方面。机器人代理在我们的日常生活中的作用,在这项研究中使用了这个服务,这只是另一个面板。
现在你可以在网络上搜索,它在可见网络上是可用的。通过购买和监控不同质量的机器人来理解自动化市场。他们是怎么做的?他们创建研究账号,注册这个平台。在这些研究账号中,他们购买关注者,但是购买不同质量的关注者:
- 永远留在你账号上的关注者
- 关注你的账号两天后就消失的关注者
所以有不同质量的机器人。他们创建账号,购买参与度,以更好地理解自动化市场及其代理是如何运作的。
第四个例子:AI偏见研究
这是关于AI偏见的研究,思考在理解数字种族主义(digital racism)的背景下。这是桑杰·夏尔马(Sanjay Sharma)的一本书,他也来自华威大学。这个想法是通过检测、揭露和干预生成式AI的输出来理解这个问题。
Midjourney案例研究
这是一个关于Midjourney的例子。这里有人使用过Midjourney吗?这是今年年初发布的Midjourney最新模型。如果你阅读文档,主要是关于模型的性能、图像如何最准确、性能、颜色等方面的内容。
但是,你可以考虑偏见研究,我们知道这些只是过去AI输出可能存在问题的一些亮点。你可以看到几个例子。我们也知道,AI社区也承认,AI方法本质上投射了单一的世界观,而不是代表多样的文化视觉身份。
这是我们已经知道的事情,对吧?然而,发生了这样一件事:两年前,巴西政治家雷纳塔·索萨(Renata Souza)在测试时写了那个提示词。如果你读了这个提示词,里面没有提到任何关于枪支的内容。她只是想要一个迪斯尼皮克斯风格的电影海报,上面有一个黑人女性。然后她描述了她想要的内容。输出结果就是那样。
考虑到这个现实,我们对此感到困惑:这种类型的输出是如何已经出现的?这是一个例子。
AI偏见研究方法与发现
所以我们提出了以下研究问题:
- 不同的视觉生成方法如何响应相同的提示词?
- 所有模型都能生成这些种族刻板印象吗?
- 如果能,它们的具体特征是什么?
我们的研究方法是:
- 使用她的提示词
- 创建另一个更不具体的提示词
- 在九个模型中创建这些图像集合来进行评估
研究发现之一是,在所有这些模型中:
- 只有微软必应(Microsoft Bing)会将黑人女性与暴力联系起来,只有这一个
- 然而,在所有模型中都存在一种倾向,即以某种方式描绘黑人女性时带有愤怒的表情或更严肃的表情
- 而且她们都是年轻的、瘦的、漂亮的,你看不到不同年龄段的表现
研究总结与资源分享
计算媒介研究的独特价值
考虑计算媒介和数字对象本身有什么特别的生产价值?我列出了一些我认为重要的点,也许你们心里还有其他想法,请告诉我:
- 你可以获得对社会趋势和文化现象的情境化社会技术洞察
- 你可以适应技术变革,因为你理解计算媒介
- 你可以根据所应用的方法调整策略来创建数据集、分析数据集并解释它们
- 你可以更好地理解用户行为和偏好
- 你可以开发新的方式来制定和解决研究问题,提出创新性发现,这是使用更传统方法无法做到的
数字方法资源
在KITS页面上,我与你们分享了一些链接。现在我要打开其中一个,也许只是浏览一些我整理的资源。这不仅仅是我自己创建的,还有许多其他同事的贡献。
你可以通过KITS页面访问,链接就在那里。或者你可以直接输入那个短链接,也可以跟着我浏览,之后再自己探索链接。
这是一个索引,为你提供:
- 研究软件(research software)
- 教程(tutorials)
- 工作表(worksheets)
- 方法配方(recipes)
- 工作坊(workshops)
- 分析图像集合的方法论(methodologies)
重要的是什么?我只给你们展示其中的几个,但是这里有很多材料。大多数时候,当学生想要开始开发数字方法时,他们需要两样东西:
- 需要确定可以用哪些软件来:
- 收集数据
- 抓取数据
- 爬取数据
- 可视化数据
- 需要知道可以使用什么类型的:
- 方法
- 配方
- 步骤流程来解释我的收集
研究工具与资源详解
这是一个包含大量信息的电子表格。你可以在这里找到各种任务的工具:
- 数据提取
- 图像下载
- 准备数据集
这可能太多了?我可以用一种简单的方式开始吗?当然可以。
我建议你看看伯纳德·里德(Bernard Reader)的页面。他是数字媒体副教授,为数字方法领域开发软件做出了贡献。在这个网页上,你可以找到所有类型研究软件的链接。
这里有人对YouTube感兴趣吗?对研究数字文化或推进任何营销项目有兴趣吗?
文本处理呢?有人对文本处理感兴趣吗?我们有一些关于这个主题的工具吗?
还有什么?巴黎的媒体实验室也有一个工具列表,用于处理网络和网络对象及平台。
对我来说这很好。你在这里可以看到工具或软件的功能:
- 收集
- 策划
- 处理
- 探索
- 可视化
教程和学习资源
我们有关于如何使用研究软件的教程,有关于收集和可视化数据的教程。有关于数据图像可视化或图像集合的教程。这里有一个关于内容审核的教程,这个是艾米莉·迪金森(Emily Dickinson)写的,非常好。
工作表资源
工作表是为像你们这样的硕士生制作的,可以一步步指导你们。每个工作表都有练习和相关的数据集供你们学习。
比如这一个是关于构建、可视化和阅读网络的。你有练习一、二、三和四。如果你进入练习,你会找到数据样本来帮助你一步步学习,有视频可以自学。
结语与问答
但是,我想告诉你们,如果你想以不同的方式使用这些工具,想用自己的方法或不同的方式来应用这些方法,而不是完全按照我今天分享的方式来做数字方法研究,这也是完全可以的。欢迎你们以最适合自己的方式使用这些资源。
系里的数字方法研究人员
在结束之前,我想和你们分享一下我们系里谁在做数字方法研究,谁有能力指导项目、论文、实证研究或基于项目的论文。以防你们不知道:
我们的团队包括:
- 莉莉安娜·莫内·格鲁普(Lilliana Monet Group),数字方法高级讲师
- 乔纳森·格雷(Jonathan Grey),批判性基础设施研究读者
- 我自己
- 大卫·莫瓦特(David Mowat),他也是数字方法讲师
如果你们对开发数字方法项目感兴趣,欢迎选择其中一位作为导师。
现在我们有时间回答问题,如果你们有的话。让我给你们一些时间思考。因为你们刚接触这么多材料,要求你们一分钟内提出问题是不公平的。也许我可以给你们三分钟时间,就像一首歌的时间。如果你们有任何问题,欢迎提出。
如果你们不好意思举手,我也可以走到你们身边,把问题带到台上回答。这样可以吗?
问答环节
第一个问题:方法区别
提问者:我叫托米科(Tomiko)。让我感到困惑的一点是文化导向方法(cultural oriented methods)、计算方法(computational methods)和数字方法(digital methods)之间的区别。我知道主要区别应该是数字方法针对的是原生数字材料,但我们应该如何对语料分析(corpus analysis)和更多基于编码的分析,比如情感分析(sentiment analysis)这类内容进行分类?
讲师回答:你说得对,其中一个区别是使用原生数字内容。另一个是数据的规模。文化分析和计算社会科学关注大数据。
如果你想做情感分析,这很好。但是要推进数字方法的思维方式,你应该考虑你处理的网络化数据。这是什么意思呢?假设我正在做情感分析,数据来自哪个网络环境?来自社交媒体。
如果我应用算法来给我输出结果,但没有考虑:
- 数据来源的特定平台的机制
- 我如何决定获取这些数据
- 相关的使用文化
- 你用来进行情感分析的算法的特殊性
所以这就是应用方法的理念和思维方式,因为你把所有这些关注点都带在身边。关于区别,就是关于什么是原生数字的,媒介是什么。媒介是网络环境平台,所以你特别关注媒介本身。数据是情境化和网络化的,不一定是大数据。
再次强调,这是一个粗略的比较,但这是我能想到的最好的方式来帮助我们理解区别。这对你有帮助吗?
所以情感分析如何分类?正如我说的,这取决于情况。你可以应用情感分析,但要考虑数据的来源,数据来自哪里,以及在解释数据时如何关注这些特殊性。所以不要把你的数据与它们来源的环境和附带的机制分开。我知道在概念上这可能很难理解,但这是我现在能做的最好解释了,抱歉。希望这有帮助。更多是关于平台机制,是的,这是一个很好的信息总结,谢谢你。
第二个问题:论文指导
提问者:我叫凯西(Casey)。我想问一个简单的问题,因为老师谈到了数字硕士项目。所以是不是只有做项目的学生可以选择你作为导师,还是实证的、理论的也可以选择你?
讲师回答:我自己和我分享给你们的所有同事作为数字方法研究者,我们都很乐意指导实证和基于项目的论文。
提问者:因为我注意到你分享了一些关于使用图表做方法论的图片。我们能用问卷调查作为方法吗?因为它们不太相似。
讲师回答:你可以使用混合方法(mixed methods)。我的意思是,这是受欢迎的,实证论文可以采用混合方法。所以也许你可以做一部分论文尝试学习一点数字方法,然后用访谈来补充。这也是可能的。
提问者:我还想问,你更喜欢那些完全使用数字方法的人,还是其他人也可以选择你?
讲师回答:好吧,我有偏见。我的意思是,我对使用数字方法研究任何类型的现象都很着迷。但我也对有趣和相关的项目感兴趣。所以我是开放的。
问答环节(续)
第三个问题:伦理审批
提问者:你好,我叫詹姆斯(James)。我的问题是关于涉及数字方法研究的伦理审批(ethics approval)。我知道与人类受试者一起工作需要伦理审批,但如果你在查看社交媒体平台上的数据,这是否仍然需要伦理审批?
埃里克回答:也许我来回答这个问题。国王学院的立场是,如果你抓取公开网络(open web)的数据,你不需要伦理审批。简单来说,如果是来自公开网络的公共数据,你不需要任何伦理审批。
不过,你可能仍然想要对数据集进行匿名化处理,比如删除用户名和任何可识别的信息。所有学生在接下来的几个月里会得到更多关于伦理审批程序的信息。这回答了你的问题吗?
提问者:是的,就是公开的…
埃里克:如果是私密的,那就不是公开网络了。公开网络必须是真正开放的,不需要密码访问。我建议现在先记住这个问题,或者把它发在论坛上。但所有学生在接下来的几个月里会得到更多关于伦理程序的信息。
讲师补充:而且如果你使用社交媒体数据或任何来自网络的数据,正如埃里克所说,有技术可以匿名化数据。当我们使用这类数据时,我们从不关注具体个人,我们关注的是集体模式。所以有技术来满足伦理考虑并以这种方式进行研究。
第四个问题:课程访问
提问者:你好,我叫阿妮塔(Anita),我想问我们现在是否可以访问你的数字方法课程?
讲师回答:谢谢你的问题。也许我要问问埃里克。让每个人都能听到她的问题,你能再重复一遍吗?
提问者:当然可以。所以她在问即使没有参加该模块课程,是否可以访问数字方法课程?
埃里克:这取决于每个模块的召集人。
讲师:如果由我们决定的话,对我来说没问题。所以你可以给我发邮件。
讲座结束
好的各位,太棒了。非常感谢你们坚持听完这个有点长的讲座。让我们休息十分钟,然后之后我们有教职员工的闪电演讲,一位同事亲自来,还有其他埃里克要和你们分享的材料。
十分钟后回来,现在是3点15分。
埃里克结语:好的,各位同学十分钟休息。然后我们会尽可能多地向你们介绍潜在的导师。休息后,你们将见到三位他们。我们的同事芭芭拉·波茨(Barbara Potts)博士在这里,我们还会给你们看来自系里另外两位优秀同事的简短视频。所以休息后回来,你们可以见到更多系里的同事。谢谢大家。
[课间休息互动与准备]
第二部分开场
埃里克:好,各位,让我们开始吧。这部分会很快。我们要向你们介绍数字人文系的三位同事,你们可能还没见过他们,也许会考虑请他们做论文导师。
首先是芭芭拉·波茨(Barbara Potts)博士。波茨博士在我们系工作多年,刚刚加入我们。现在请波茨博士给我们介绍她的研究,我很期待听到这些。
芭芭拉·波茨博士的介绍
波茨博士:谢谢你,埃里克。大家好。你们中有些人可能从写作实验室认识我,也许还有一些人是从社交媒体营销和平台模块认识我的。我先说说我的一些出版物,然后谈谈我的教学和指导经验及兴趣,以及这些如何与我的研究相连。声音还好吗?大家都能清楚地听到我说话吗?
研究著作介绍
首先说说我的书。这本书叫《胖者的电影形象》(Fat on Film),副标题是”性别、年龄、种族和身体尺寸”(gender, age, race and body size)。我通常说这是关于当代好莱坞电影中胖、种族和性别的交叉研究。说到”当代”,我是从2000年开始研究,一直到2019年,因为那时我必须提交手稿。所以现在有一些有趣的内容已经遗漏了。
基本上,我在这本书中提供了好莱坞电影中胖者形象的一种映射。比如,有不同的比喻手法(tropes),有”胖食者”(fat eater)的比喻,还有作为物理喜剧一部分的胖身体形象。
另一个最近出版的作品是《为什么你的身体形状不同》(Why is your body a different shape)。我不知道你们中有多少人看过漫威MCU电影,但促使我写这篇文章的是MCU电影中的”胖索尔”(fat Thor)。当克里斯·海姆斯沃斯(Chris Hemsworth),一个通常以健美强壮著称的演员,穿上肥胖装(fat suit)扮演胖索尔时,引发了很多讨论。我想看看是否有人在学术上写过这个主题,结果发现没有。我想,好吧,那我来写。
然后我还写了关于《蜘蛛侠:平行宇宙》(Into the Spider-Verse)和其中的彼得·帕克(Peter Parker),因为这两者都涉及胖和男性气质的关系。
恐怖电影研究
另一个出版物是一个书章,正如标题所说,是关于东欧作为恐怖之地(Eastern Europe as the land of horrors)。这与我在电影研究中的第二个主要研究兴趣有关。第一个主要研究兴趣是胖者的形象表现,第二个是恐怖电影。这本来是我认为可能成为一个更长期的项目,但遗憾的是后来没有发展成那样。不过我写了这个章节。
基本上,我在这里描述的也是当代电影。具体来说是关于自2000年代中期以来出现的一波电影。第一部,可能也是最著名的一部是伊莱·罗斯(Eli Roth)的《人皮客栈》(Hostel)。这些电影的共同点是,它们都是北美或西欧的恐怖电影,但故事设定在东欧,特点是西方游客到该地区旅行,然后成为当地人的受害者。
所以这与我的其他出版物的共同点是对表征(representation)的关注,特别是他者化(othering),因为这里是对胖人的他者化,而在那里是对整个东欧的他者化,不仅仅是东欧人。
数字人文领域的研究
如果你们现在在想,”这一切都很有趣,但听起来不太数字化”,对吧?这与我在数字人文领域的教学和指导兴趣有重叠。
研究主题
身体研究
如我所说,身体,是的。我研究胖者,我的方法来自胖者研究(fat studies)。如果你知道什么是胖者研究,我可以说它是胖者接纳(fat acceptance)的学术分支。如果你知道什么是胖者接纳,它基本上是身体积极性(body positivity)发展而来的。这是极大的简化,但大致就是这样。
所以我对这方面很感兴趣。我也已经在这里指导过关于社交媒体上身体积极性的论文。我认为这是我绝对感兴趣的事情。我指导过很多论文,不一定是关于身体积极性,但是关于身体形象(body image)的,大多数与社交媒体有关。这是一个相当受欢迎的研究主题或领域。所以我在这方面有经验,很乐意指导任何相关内容。
我也可以说,虽然不是今年,但去年我在数字媒体中的身份认同(Bodies Identities in Digital Media)模块上教学。所以如果你有从那里发展出来的内容,也可以来找我。
性别研究
我试图列出所有内容,也许太多了,但总的来说,我很乐意指导任何与性别有关的内容。我确实有我的专长,通常是关于表征或如我所说的交叉性(intersectionality)。但在性别方面,我也指导过各种各样的论文。我过去两年教授性别与技术(Gender in Technology)课程,虽然今年没有。所以如果有任何从那里发展出来的内容,也可以找我讨论。
电影与数字媒体研究
电影研究
我知道你们不是在学习电影研究,但数字电影(digital cinema)可能是你们中一些人感兴趣的领域。如果是关于制作、发行、展映,或者是关于风格的研究,我都很感兴趣。我认为有很多有趣的潜力去分析数字化对电影风格的影响,它如何影响电影风格。
流媒体平台研究
如果对电影流媒体平台感兴趣,我现在正在教授一个关于平台的模块。近年来也有很多关于大型流媒体服务商的公共讨论,通常是关于Netflix,但也包括其他平台。如果你有任何与此相关的内容,这也属于我的研究兴趣范围。
技术表征研究
还有一个稍微不同的主题领域是电影中的技术表征(representation of technology in film)。我知道这里的学生有时也会做这方面的论文。比如,我知道去年有人做了一个关于女性机器人(female cyborg)表征的论文。如果有类似的内容,我也很乐意指导。
社交媒体研究
然后我还有一些到目前为止我的研究还没有涵盖,但已经被我的教学和指导工作覆盖的其他兴趣领域:
社交媒体营销
如我所说,我这学期在教授社交媒体营销和平台课程。显然,如果你在我的小组里,如果有什么让你感兴趣的,我会很适合指导。
我们已经在这里有一些重叠,因为我指导过的很多社交媒体研究都是关于身体形象的,有时是关于性别,有时两者都有。但我也指导过其他内容,比如小红书(Little Red Book)上的女权主义倾向,这是我几年前指导过的。
TikTok研究
我还在这里提到了TikTok,因为我最近开始做一些关于TikTok的研究,虽然还不能展示,但这意味着我也很感兴趣指导关于TikTok的研究。
媒体与政治研究
我还有一个相当广泛的兴趣,就是媒体和政治(media and politics)。我有政治科学的辅修学位,这起到了作用,而且我也教授过这个主题。我在另一所大学召集过一个关于媒体和政治的模块,涵盖了相当多的内容,还有一个更具体的关于当代媒体行动主义的模块。
媒体和政治也大量涵盖了媒体行动主义。我知道你们这里也有一个模块,我知道你们可能把我的同事作为第一选择,他们教授关于社交媒体抗议运动的模块。但是,我也很乐意成为第一选择。
政治与幽默研究
我还列出了一项内容,因为我在我召集的这两个模块中都讨论过,而且我总体上也很感兴趣。我认为这对数字人文来说很重要,那就是政治与幽默(politics and humour)。
我认为显而易见的是政治迷因(political memes)或政治和迷因,但我认为在社交媒体上的政治喜剧方面也有很多事情在发生,或者总的来说,幽默在社交媒体上的政治表达中有多么重要。如果有任何属于这个范畴的内容,我都会感兴趣。
这基本上就是我要说的全部了。不知道你们有什么问题?如我所说,你们也可以随时给我发邮件,如果你们想要确认什么或对任何内容感兴趣。
马克·戈瑟姆博士的介绍
埃里克介绍:非常感谢波茨博士。观众有什么快速问题吗?正如她所说,如果你们有任何问题,也可以随时给她发邮件。这真是一个令人惊叹的专业领域范围。我们每年都会看到很多这些领域的论文。
接下来我们有马克·戈瑟姆(Mark Gotham)博士的视频。很遗憾他今天不能来这里,所以他发来了一段简短的视频。我们系刚刚聘请了戈瑟姆博士,我个人对此感到非常兴奋。戈瑟姆博士是世界领先的数据和音乐学者之一。所以如果有人对音乐感兴趣,那这位就是你要找的人。
戈瑟姆博士的视频内容
大家好,我是马克·戈瑟姆,我研究音乐计算(music computing)。你们可能会问为什么要在数字部门(DD)的背景下研究音乐这样的主题,也许会问这包括哪些主题。
音乐研究的重要性
首先,关于音乐,最强有力的动机可能是它无处不在。全世界所有文化,在所有有记录的历史中,音乐都是其文化活动的核心部分,包括重要的社会功能。
还有一个务实的论点是纯经济影响。与一些报道所说的相反,这实际上是一个很大的产业。
对我们研究者来说,也许最好的动机是学术挑战和机遇。在模拟人类智能创造力方面很有趣。在一个比其他领域探索较少的领域这样做可能特别有趣,也许最重要的是将不同领域连接在一起:音乐、语言、图像、视频等。
研究主题范围
至于哪些主题,音乐计算领域有很多,我只想强调其中一些我个人研究过的,这样我就能很好地指导这些主题。我可以从创作音乐、分析音乐和更广泛的参与这三个方面来组织内容。在最好的情况下,这三者是密切相关的。
贝多芬第十交响曲项目
在创作方面,到目前为止,我参与的最大项目是创作贝多芬第十交响曲构想的实现版本。这是由德国电信(Deutsche Telekom)资助的学术产业合作项目,基本上涉及的问题是如何从贝多芬留下的很少且贫乏的草图中得到成果,更神秘的是,如何从他用文字记录的想法中得到成果。所以不是用音符,而只是用一般的文字描述他可能写的音乐类型,最终变成一个完整的交响乐团可以演奏的作品。
2021年一个交响乐团确实演奏了这部作品,吸引了1000万观众,为德国电信赢得了各种新闻奖项,因此从他们的角度来看也是一个巨大的成功,同时也推进了我们对这类主题所需过程的研究理解。
多元音乐研究
流行音乐研究
我自己的主要专长和训练是在西方古典音乐领域,但我也很高兴写一些关于流行音乐的主题,特别是关于时间、节奏和节拍的内容。近年来,我还通过与西方以外的音乐专家的合作,扩展了我的研究组合,这非常令人兴奋和有趣。
马里音乐项目
这包括与我的一个学生合作的马里音乐项目,研究马里的三鼓组合的微时序。这是我们正在处理的一些数据,我们为实时编码应用程序Sonic Pi制作了一个插件,允许用户修改他们实时生成的音乐分数的时序,以更好地反映该流派的特点。
印度和孟加拉音乐研究
我们还做了一些关于印度和孟加拉音乐的工作。这是一个正在进行的工作。已经做了一些关于分类问题的工作,在这种情况下是分类。我们还在思考如何仔细编码来自世界各地的不同类型的音乐符号表示。
韩国音乐研究
最后,我们做了一些关于韩国音乐的项目,特别是15世纪宫廷音乐。这项研究在全国国际音乐信息检索会议(National International Conference for Music Information Retrieval)上获得了最佳论文奖,这是该领域的旗舰会议。涉及多个步骤,如你在右边看到的,15世纪的资料和光学字符识别,以及将该资料转换为计算机可读格式的类似任务,机器学习过程用于从中学习和生成新材料。
音乐分析方法
从音乐创作转向分析,这实际上是所有创作任务的基础。为了做好创作工作,我们确实需要理解我们正在处理的领域,理解我们正在处理的数据。我将列举一些我们最近处理的项目示例。
和声分析
这通常涉及可能性空间和围绕它的数学组织。同样可以涉及从旧资料进行光学字符识别类的任务,一旦你准备好所有这些数据进行比较,就可以进行一些相对标准的数据科学。例如,比较特定和弦和进行在不同数据集中的普遍程度。
形式分析
分析当然不仅限于和弦,我们还研究形式。比如,如果你想到一首带有verse-chorus结构的歌曲或ABBA,这就是我们在这里研究的内容。我们研究了各种方法来模拟音乐中的复杂形式结构,包括树形结构,通过这种方式,可以完成的任务之一是比较不同音乐项目的相似性,不是从旋律角度,而是从纯结构角度。两首曲子的结构有多相似?
旋律研究与公共资源
旋律分析
第三个例子是旋律的存在。在有歌手主唱的歌曲中这可能很明显,但在许多音乐资料中,主旋律在哪里并不是很清楚。例如,在这个交响乐中,如果你看不懂乐谱也没关系,你可以看到主旋律在不同声部之间移动。所以我们有一些脚本来注释这些,并将它们拼接在一起,再次创建可用于生成分析等更多用途的数据。
这也意味着我们可以制作一些面向公众的资源,比如我们的应用程序Tilia的这个截图,这很好地引导我们进入最后一个主题。
公共参与
如我所说,在最好的情况下,这些项目涉及数据的创建、对该数据的基础分析和研究,以及面向公众的资源的制作。这里有三个例子:
- 左边是一个乐谱库的二维码,这是我们准备的创作共用零许可的音乐资料
- 中间是对这些资料的几个分析
- 右边是将所有这些数据整合到一个在线的、免费的教科书中,到目前为止已经有几百万访客
如果音乐本身不吸引人,那么请注意音乐还附带了大量元数据。
演出曲目单研究
这里我要简单介绍一下演出曲目单(setlists)的主题,也就是说音乐家在音乐会和巡演中演奏什么歌曲。我们有一些有趣的初步数据,关于在一次巡演中和巡演之间的一致性,以及在艺术家职业生涯过程中的情况。所有这些都是公开可用的数据。
我们还看到一些你可能预期的相关性,比如场地规模和音乐会长度之间的关系。随着艺术家越来越受欢迎,他们可以在更大的场地演出,可以演奏更长的节目单,等等。
感谢你们今天的关注。如我所说,我对各种音乐主题都感兴趣。今天我向你们展示了我最近在做的一些项目。很期待听到你们可能有的想法。谢谢。
乔丹娜博士的介绍视频
最后,我们有一个很短的视频。乔丹娜(Jordan)博士也给我们发来了一些关于她研究的信息。
乔丹娜博士的自我介绍
大家好,我是乔丹娜,是KLS数字人文系的数字文化与人文讲师,也是我们新的数字未来(Digital Futures)硕士项目的联合主任。
我的研究集中在围绕媒体技术、知识和数字文化之间关系的理论范式上。我研究过自动化内容系统和人类编辑在维基百科等大型系统中的历史关系,以及他们呈现的集体智能和合成智能的交叉点。
目前,我正在关注它们在知识平台中的表现特征,特别是在提取、搜索、引用和模态性方面。我正在设计一个项目,探索善意的AI研究项目和发展中反映的伦理价值观类型,以及它们带来的社会经济和生态可持续性方面的紧张关系。
乔丹娜博士的教学经历
你们中很多人会从我们的《数字文化与社会导论》(Introduction to Digital, Culture and Society)模块认识我,还有一些人是从我与米(Me)一起召集的《作为数字城市的伦敦》(London as a Digital City)模块认识我的。这个模块对我来说非常重要,它与我过去在数字城市和创意公民身份方面的研究相连,最重要的是与”超越智能”(Outsmarted)项目相连,该项目探索了伦敦作为一个学习型城市的概念,最终产出了几篇出版物和一个很棒的桌游及方法工具包,这是我与迈克尔·杜根(Michael Dugan)一起设计的。谢谢,再见。
讲座结束
埃里克:好的,今天的内容就到这里。再次感谢奥米拉(O’Meara)博士的精彩演讲。希望你们喜欢认识我们这里的几位同事。请在2月24日之前提交那些论文表格。请提交论文导师表格,就这些了。晚安。
[课堂结束的一些闲聊和收尾工作]
让我用一段话清晰简明地总结数字方法(digital methods)的核心概念:
数字方法是一种独特的研究方法,它以网络原生(natively digital)的方式研究数字世界和社会现象。这种方法的特别之处在于,它不仅仅是使用数字工具来研究,而是认真对待整个技术环境本身 – 包括平台机制(platform mechanisms)、算法(algorithms)、用户行为(user behaviors)等。比如,当研究社交媒体上的某个现象时,你不能只看内容本身,还需要理解平台的算法如何影响内容展示、用户如何使用和重新利用(repurpose)平台特性、以及平台的技术限制如何塑造用户行为。这种方法强调将研究对象和数字环境视为一个整体来理解,而不是简单地把互联网当作数据收集的工具。
这与传统的把线下研究方法搬到线上,或者仅仅使用数字工具来分析数据的方法有本质区别。数字方法要求研究者”跟随媒介”(follow the medium),理解并利用数字平台和对象的特性来进行研究。
by Claude