您当前的位置:首页 >  技术动态 >> 
基于特征学习的智能边缘计,其QoS的预测,会对结果产生什么影响

时间:2023-08-27 09:19:09    来源 : 个人图书馆-netouch

文丨五年宝

编辑丨五年宝


(资料图片)

前言

5G和未来6G技术的兴起将为未来通信网络的建设做出巨大贡献,而网络终端用户和服务的数量大幅增长,这给用户选择与不同设备的需求相匹配的服务提出了挑战。

智能边缘计算(IEC)支持更多节点负载流量并提高通信速率,欧洲电信标准协会(ETSI)将这一新兴范式定义为多接入边缘计算,将计算能力更加贴近边缘网络。

从而使智能设备能够通过不同的网络模式调用服务,以满足边缘计算的需求,以及低延迟。

QoS人工智能以及最新智能服务

另一方面,边缘节点提供的人工智能技术支持的智能服务数量越来越庞大,需要更准确的智能服务预测模型。

而服务质量(QoS)一直是衡量服务是否适合用户的关键标准,所以QoS的预测成为服务推荐中的关键问题。

在未来的通信场景中,QoS容易受到用户异构设备和网络环境复杂性的影响,而且用户可以从多种智能设备,比如说可穿戴设备、手机、平板电脑和笔记本电脑调用服务。

但不同的设备对服务有不同的QoS感知,即使对于相同的服务,QoS值也可能完全不同,这就要求预测模型需要对各种设备敏感。

不光如此,设备的网络接入方式也对QoS值有显著影响,用户由于接入的网络模式不同,会得到不同的QoS。

所以预测系统需要感知网络模式的接入,而其他因素也会在一定程度上影响QoS,例如地理位置、IP地址、身份证号码等。

为了做出准确的QoS预测,人们采取了不同的努力,而QoS预测的研究可以分为最近邻(NN)、矩阵分解(MF)和深度学习(DL)方法。

NN方法有着这样的假设:如果用户过去有类似的QoS体验,他们将来也会有类似的QoS体验,但神经网络方法仅利用邻域的信息进行预测。

从而忽略了隐藏在整个用户服务QoS矩阵中的有益信息,与NN方法不同,MF方法通过使用QoS矩阵中的全部可用数据学习的用户和服务隐式特征矩阵提供QoS预测。

但是MF的性能受到用户潜在特征向量和服务潜,而且在特征向量的简单线性点积的限制,根据服务QoS预测、因子分解机(FM)和多层感知器(MLP) 的深度学习取得了巨大的发展。

根据深度学习的方法为推进服务QoS预测提供了前所未有的机会,IEC方向的AI技术提高了预测精度但构建更准确的QoS预测器仍然面临挑战。

为了缓解这些关键挑战,研究人员提出了一种名为矩阵分解自动交互网络(MFAIN)的方法来自动学习高阶特征交互。

在研究人员的方法中,他们将上下作为显式特征,例如地理位置、IP地址、ID号等,同时为了利用与设备相关的信息,他们将聚类算法获得的设备类型和网络模式作为显式特征。

通过MF提取包含潜在关系的隐式特征,研究人员又利用所有这些特征生成的向量来馈送基于多头自注意力机制的交互网络,以学习低阶和高阶特征交互。

而注意力机制用于衡量特征之间的相关性,还可以确定应组合哪些特征以形成有意义的高阶特征。

有实验结果表明,研究人员的模型在预测精度方面表现出色,与最先进的方法相比,他们的方法在RT和TP的最佳基线上分别实现了平均MAE11.1%和11.6%的改进。

不光如此,研究人员们的模型在利用异构上下文特征方面具有良好的鲁棒性和可扩展性,而其余部分组织如下: 相关工作部分 展示了他们的相关工作,动机部分介绍了动机场景。

他们的方法部分介绍了基于MF和特征学习的服务推荐方法,有实验并且评估部分描述了实验和评估,根据结论和未来工作部分总结有关于QoS未来工作的预测。

相关工作

根据现有的QoS预测研究,研究人员将工作分为传统的NN、MF和DL方法,而根据有传统方法是基于神经网络的QoS预测,其优点是易于在传统服务计算环境中实现。

这种方法的核心是计算相似度,之后进行协同过滤,有一部分研究人员提出使用基于皮尔逊相关系数(PCC)计算的用户相似度的协同预测方法。

而后又提出了一种混合模型,通过置信权重线性集成基于用户和基于项目的方法,他们考虑QoS数据的分布特征来计算相似度。

但需要注意的是,在实际场景中,单个用户无法调用所有服务,这会导致数据稀疏问题,在这种情况下,无法选择用户和服务的邻居。

为了减轻数据稀疏性的影响,Liu提出了一种方法:位置感知相似性度量,以借助位置信息来查找用户和服务的邻居。

之后又有研究人员提出,一种通过计算用户或边缘服务器相似度的服务推荐方法,通过NN方法仍然忽略了隐藏在整个数据中的有用信息。

而他们提出的MFAIN方法旨在利用整个数据来训练和提高QoS预测的准确性,但MF是另一种协同过滤方法。

MFAIN方法

MF与仅使用邻居信息进行QoS预测的方法不同,而是使用所有可用的QoS数据来学习用户和服务的隐式特征表示。

尽管现有的MF方法尝试将位置、相似关系和上下文信息集成到MF中,但其性能仍然受到用户潜在特征向量和服务潜在特征向量之间的简单线性内积的限制。

随着IEC环境中上下信息的放大,需要捕获用户和服务之间更多的非线性交互,但在最近有一些探索性工作基于DL模型进行QoS预测。

FM是解决稀疏数据特征组合问题的有效技术,从而研究人员引入了FM并使用二阶特征交互来建模用户和服务之间的真实交互。

这种技术将用户和服务的邻域作为补充特征,并将其放入FM中进行交互式学习,但低阶特征交互不足以适应复杂的特征关系。

考虑到用户和服务之间的真实交互是复杂且非线性的,Zhang提出,将用户、服务和位置信息输入one-hot编码后的MLP中。

并且利用ReLU函数实现用户和服务之间复杂交互的非线性变换,为了利用用户邻域信息来提高预测精度,Gao通过融合用户和服务的邻居的潜在集群特征改进了MLP的嵌入层。

通过精心设计的左右结构结合了FM和MLP的优点,并利用上下信息来提高QoS预测的准确性。

但除了利用上下信息之外,有更多的研究人员使用隐式信息来提高预测准确性,有研究人员提出了一种位置感知特征交互学习(LAFIL)方法,用于预测用户服务矩阵的QoS值。

在这之后,通过学习隐藏在有关位置信息的特征中的底层关系来进行推荐,考虑到卷积神经网络(CNN)的优点,Yin提出了一种MF和CNN联合模型。

这是一种充分利用了服务调用过程的邻域特征、公共隐式特征和深层隐式特征,所提出的模型解决了如何提高邻居选择质量以及如何从QoS记录中学习深层隐式特征的问题。

之后研究人员又提出了JDNMFL,它构建了一个基于CNN的联合深度网络来学习局部关键特征交互,并应用MLP从原始特征和局部特征交互中学习全局特征交互以进行QoS预测。

尽管现有方法考虑了很多背景因素,但在面对设备服务的IEC环境目标时,设备类型和数量的增加使得设备信息在预测中发挥着越来越重要的作用,而这一点并未得到充分考虑。

根据上文描述的深度学习的方法,并没有过多关注特征的高阶交互的影响,但为了丰富用户特征和服务之间的交互方式,Chen提出了一种上下文感知特征交互模型(CFM)。

通过联合考虑与FM的低阶特征交互以及与MLP和深度交叉网络(DCN)的高阶特征交互来捕获记忆和泛化。

而LAFIL利用压缩交互网络(CIN)仅进行位置信息的特征交互学习,研究人员对此提出了一种用于上下QoS预测的通用深度神经模型(DNM)。

这种模型分别学习用户侧和服务侧的特征交互,但忽略了用户和服务之间的特征交互,但未曾想到,现有的基于深度学习的特征交互学习方法没有区分不同特征交互的重要性。

他们为所有特征交互分配相同的权重,从而忽略了低相关性特征交互的识别和处理,严重影响了QoS预测的准确性。

与现有的工作相比,研究人员的工作考虑了IEC环境中用户设备的特性,并且使用矩阵分解来丰富上下文隐式特征,这些特征通常被交互层中的现有特征学习方法所忽略。

但在最后,使用多头自注意力机制自动学习低阶和高阶特征交互,从而允许每个特征与其他特征交互并通过学习确定相关性。

显式特征嵌入

为了考虑IEC环境中的各种上下特征,研究人员将用户侧和服务侧中与服务调用相关的特征作为显式特征。

在这样的前提下,研究人员考虑了12个显式特征,其中包括用户ID、服务ID、用户和服务的地理位置、用户和服务的IP地址、用户和服务的自治系统。

直接从原始数据集中的用户和服务信息获取的用户和服务的IPNo,分别在TP和RT矩阵上通过聚类算法得到用户设备类型和用户接入的网络模式。

考虑到复杂的IEC环境下设备的多路接入,这就要考虑用户设备的特性,为了扩展设备特征,研究人员发现不同用户对同一服务的QoS具有聚类特征。

对于数据集中的部分用户,可以假设同一类型的用户使用相同的类型设备和网络接入方式,而后他们又使用K-means聚类算法。

以此来获取基于服务质量的用户设备类型和接入网络方式两个现实特征,而K-means聚类是最简单且流行的无监督机器学习算法之一。

它识别k质心的数量,然后将每个数据点分配到最近的簇,同时保持质心尽可能小,但研究人员对调用相同每个服务的所有用户进行聚类。

之后又对所有服务的聚类结果进行平均,可由于设备的类型与吞吐量关系更大,而设备的网络接入方式与响应时间关系更大。

他们对RT和TP数据集进行上述操作,分别获得这两个显式设备特征,而特征转换在许多分类或回归预测任务中至关重要,因为单独使用原始特征很少会产生最佳预测结果。

为了获得最佳结果,原始特征转换通常需要大量的工作,所以研究人员使用one-hot编码来预处理显式特征。

字段的概念首先在点击率(CTR)预测中提出,这些字段有两种类型的数据:一类是离散数据或分类数据,另一类是连续数据。

在一些研究中,有研究人员将所有字段作为分类表数据,并将它们形式化为one-hot编码,这是一个指定维度设置为1的高维零向量。

假设如果有三个用户,则one-hot向量的维数设置为三。那么ID为1的用户可以表示为,ID为2、3的用户可以分别表示为0.1和1。

在他们的方法中,从12个显式特征生成18个字段,其中冗余字段是从用户和服务的IP地址生成的,并用符号“.”分隔。

通过实验,研究人员将用户IP地址生成为四个字段,并用符号“.”分隔,并对服务IP地址进行同样的操作。

此操作有两个好处:第一是考虑到IP地址中相同的本地字段可能共享相同的地理信息,第二是考虑到有更多的特征意味着交互层中更多的特征交互。

结论

网络技术的进步使得人们调用服务能够满足高密度、低时延的需求,而服务质量(QoS)预测对于用户在未来复杂的通信场景。

从中大量功能相似的Web服务中找到合适的服务至关重要,但当前的QoS预测算法无法充分考虑智能设备周围的上下信息以及用户和服务之间的底层关系。

在一些研究者,有人提出了一种预测模型,将上下信息结合为显式特征和隐式特征,然后输入基于交互层的多头自注意力机制来学习低阶和高阶特征交互。

这样方法的关键是新引入的交互层,它允许每个特征与其他特征交互并通过学习确定相关性,在真实世界数据集的实验结果证明了研究人员提出的模型的有效性和效率。

不光如此,他们的方法提供了出色的模型可扩展性,拥有的特征越多,获得的预测就会精度就越高。

当与MF捕获的隐式特征集成时,与之前最先进的方法相比,研究人员实现了更好的MAE和RMSE。

在未来的工作中,他们将尝试考虑时间序列来解决动态QoS的实时预测问题,而研究人员的方法提供了出色的模型可扩展性。

标签:

热门推荐

X 关闭

X 关闭