跳过主要内容

基于fpga加速神经网络的mri脑肿瘤分割

摘要

背景

脑肿瘤分割是医学图像处理和分析中有挑战性的问题。这是一个非常耗时和错误的任务。为了减少医生的负担并提高分割精度,需要开发计算机辅助检测(CAD)系统。由于深入学习技术的强大特征学习能力,许多基于深度学习的方法已经应用于脑肿瘤分割CAD系统并实现了令人满意的精度。然而,深度学习神经网络具有高计算复杂性,并且脑肿瘤分割过程消耗很大的时间。因此,为了达到脑肿瘤的高分割精度并有效地获得分割结果,迅速加快脑肿瘤的分割过程非常苛刻。

结果

与传统计算平台相比,FPGA加速卡大大提高了速度和功耗。基于BraTS19和BraTS20数据集的脑肿瘤分割加速器,比TITAN V GPU和Xeon CPU分别快5.21倍和44.47倍。此外,通过能效比较,我们的设计可以达到GPU和CPU能效的11.22倍和82.33倍。

结论

我们对神经网络进行量化和再训练以进行脑肿瘤分割,并合并批量归一化层以减少参数大小和计算复杂度。基于FPGA的脑肿瘤分割加速器设计用于映射量化的神经网络模型。加速器可以提高分割速度并降低功耗这为脑肿瘤的自动分割和远程诊断提供了新的方向。

同行评审报告

背景

脑胶质瘤是由大脑和脊髓的胶质细胞癌变引起的最常见的恶性肿瘤。它具有发病率高、复发率高、死亡率高、治愈率低的特点。脑肿瘤分割的目的是将肿瘤组织从健康脑组织中分离出来,如白质、灰质、脑脊液等[1].它在脑胶质瘤的诊断和治疗中起着重要作用。

胶质瘤图像分割有助于手术规划,提高生存率。目前,大部分脑肿瘤图像的分割是由医生完成的。在临床实践中,由于脑肿瘤图像数量的不断增加,人工分割脑肿瘤的不同区域成为医师容易出错且耗时的任务。此外,医生的认知可能会对后续治疗方案的制定和手术产生不同的影响。因此,高精度的脑肿瘤定位和分割需要自动化的方法。

在过去,计算机辅助设计系统是使用CPU来完成计算的。由于CPU处理数据的速度不理想,许多GPU加速方法逐渐被研究[23.].对于生物信息学中的一些机器学习算法,FPGA加速也成为一个新的方向[45].

相关工作

自动脑肿瘤细分在研究界引起了广泛的关注,并被持续研究。在2010年之前,大多数研究人员使用标准图像处理方法,例如基于阈值的方法[6]和基于区域的方法[7]Suzuki等人使用迭代阈值算法进行分割[6,但当图像对比度较低时,阈值的选取就变得困难。2005年,区域生长法被证明是一种有效的脑肿瘤分割方法。与其他非基于区域的方法相比,计算量更少,特别是对于同质组织和区域[7].虽然它们实现简单,计算量小,但分割精度达不到实际期望。因此它主要只用于二维分割[8].随后,机器学习[9]已逐渐应用于医学图像分析。许多研究者提出了基于分类或聚类的脑肿瘤分割方法[10.11.12.]Fletcher Heath等人使用无监督模糊聚类算法,该算法结合领域知识和图像处理技术来实现肿瘤分割[10.].Zhou等人提出了一种基于一类支持向量机(SVM)的方法从磁共振成像(MRI)中提取脑肿瘤[11.].Subbanna等。介绍了基于多窗道Gabor滤波器的分割脑肿瘤的全自动分层概率框架和适应马尔可夫随机场(MRF)框架[12.]与传统的分割方法相比,这些方法可以提高分割精度。然而,在临床实践中仍然需要更高精度的方法。

在过去的十年中,随着计算能力的巨大增长,深度学习方法也在不断进步。深度神经网络可以从输入图像中彻底学习层次特征,而不是预先定义的人工特征。有许多知名的深度学习网络,如卷积神经网络(CNNs)和递归神经网络(RNNs),它们逐渐应用于医学图像分析的各种任务中,如乳腺图像分析[13.]及胸部x光影像分析[14.].与此同时,基于深度学习网络的脑肿瘤分割也引起了研究者的兴趣。

2014年,D. Zikic等研究了将cnn直接应用于脑肿瘤分割的可能性,其分割精度高于传统机器学习方法[15.].2016年Brosch等人提出了一种基于深度3D卷积编码器网络的分割方法,该方法由两条相互关联的路径组成,即卷积路径和反卷积路径。每个图像都包含一个具有相应变化的重复结构。因此,训练一个网络只需要少量的图像[16.].2017年,提出了一种用于脑肿瘤分割的多路径CNN网络,作为单路径前馈CNN的扩展[17.].多路径CNN可以从不同的模态提取不同的特征。2019年和2020年,Muhammad Sharif和Javaria Amin等。提出了几种脑肿瘤分割算法[18.19.20.21.,进一步提高分割精度,减少处理时间。我们的设计是基于[22.,扩展了U-Net网络[23.]和替换3D操作的所有2D操作。这是一个多路径网络CNN能实现分割任务丝丝入扣。

挑战

虽然显著的进步已经在脑肿瘤分割已作出,但仍有待解决的问题和挑战。首先,脑胶质瘤是神经胶质细胞的突变。由于神经胶质细胞的广泛空间分布,可以胶质瘤大脑中的任何地方出现。此外,形状和在不同患者的脑肿瘤的大小有很大的不确定性,其分割处理之前的手段,几乎没有可提供的先验信息来描述肿瘤的形状和尺寸。位置的不确定性和不确定性的形态带来了很大的挑战,准确定位脑肿瘤。其次,MRI提供了组织的细节可以在多个方向上进行成像。3D成像的方法是更有利于检测脑肿瘤的,所以我们主要集中在MRI分割脑肿瘤。然而,在自动过程的MRI计算是复杂的,这通常需要用于图像分析的更多的时间。目前是分段处理平台苛刻的性能要求。

可以得出结论,深度学习方法在脑肿瘤分割任务中可以达到较高的准确率。然而,脑肿瘤分割过程可能会消耗大量的时间和计算资源。因此,加速基于CNN的三维脑肿瘤分割是实现高精度脑肿瘤检测和有效获取检测结果的关键。为了加快分割过程,GPU目前用于脑肿瘤分割,但在速度和功耗方面可以进一步提高。

CNN在两个过程中实现脑肿瘤分割:培训和推理。培训是培训参数的迭代过程。在培训过程中,将模型的输出与预期结果进行比较,以更新参数以最小化差异。重复该过程,直到输出结果会聚到将间隙降低到可接受范围的值。培训是典型的离线操作,可以提前完成。推理过程是实时的,所以我们的工作侧重于加速推理过程。

脑肿瘤的神经网络分割

数字1说明了三维U-Net结构,包括三维卷积层、三维反卷积层、池化层、激活层和批处理归一化(BN)层。蓝框上的数字是通道的数量,下面的数字是分辨率。与U-Net类似,三维U-Net由左边的分析路径和右边的合成路径组成。左边的分析路径包括三维卷积层、BN层和整流线性单元(ReLU)层。使用最大池化层来减小特征图的大小。右侧合成路径包括三维卷积层、三维反卷积层、BN和ReLU层。与左边的分析路径不同,合成路径通过反卷积层扩展了特征图的尺寸。

图1
图1

三维u型网结构

3D U-Net可以提供3D医学图像的深度信息,与2D CNN分段网络相比,女巫具有更高的分割精度。与此同时,它还带来了大量的计算和参数。因此,有必要加快CNN脑肿瘤的加工,以实现快速和高精度的脑肿瘤细分。

方法

我们设计了一种基于fpga的脑肿瘤分割推理加速器,加速了分割过程。可以证明,我们基于fpga的设计优于传统的计算技术,如CPU和GPU实现。在本节中,我们首先描述硬件平台和软件平台,以及数据集。然后给出了脑肿瘤分割神经网络的量化过程和硬件加速结构。

硬件和软件平台

硬件:用于脑肿瘤分割的神经网络硬件加速器基于Xilinx的Alveo U280加速卡,其具有1304k LUT,2607K寄存器和9024 DSP切片。我们加速器的硬件平台如图4所示。2.以NVIDIA的TITAN V GPU和Intel的Xeon CPU E5-2620 V4 CPU为例进行比较。

图2
figure2

用于脑肿瘤分割的硬件平台,其中红色的是Xilinx Alveo U280加速器卡

软件采用Xilinx Vivado集成环境和Synopsys VCS模拟器进行硬件设计和仿真。基于单精度浮点的GPU参考设计采用CUDA 10.1编译,使用python 3.8.3的PyTorch和cuDNN 7.6.3库。

数据集

BraTS19和BraTS20数据集[24.25.26.用于测试每种情况的四种模式的脑肿瘤分割的性能。单个脑肿瘤的形态可能导致不准确的细分,因为它没有提供详细信息。多模态图像可以有效地相互补充,可以提高分割精度。数字3.展示了一个带有四种核磁共振成像模式的样本,天赋t1,t2和t1ce.每一种都代表一种独特的MRI检查方式。右边的图像是图中的分割结果。3.

图3
图3

输入图像具有四个MRI模态和对应的分割输出

分割神经网络量化

为了减少计算量并在FPGA硬件中实现网络,有必要对模型进行量化。三维u网的量化过程包括以下三个步骤[27.]:合并BN层,量化网络参数和量化网络活动数据。以上三个步骤详述如下。

合并BN层

三维U-Net中的BN层可以提高训练质量,但对推理不是必需的。在量化之前,可以将BN层合并到之前的卷积层中,简化网络结构,减少网络计算量和参数数量。方程12描述卷积层和BN层的合并过程。在情商。1XY表示卷积层的输入输出,和WB为卷积核的权值和偏差。在情商。2\(\亩\)\(\ sigma \)\γ(\ \)β\ (\ \), 和\ε(\ \)表示输入平均值,输入标准偏差,比例因子,偏移和十进制,以防止分别从零的分别。

$$\begin{aligned}Y=&{}W\cdot X+B\end{aligned}$$
(1)
$$\begin{aligned}\hat{x_i}=&{}(x_i-\mu)/\sqrt{\sigma^{2}+\epsilon}、\nonnumber\\y_i=&{}\gamma\hat{x_i}+\beta\end{aligned}$$
(2)

通过结合方程式。12,则BN层合并后的参数如式所示。3.4方程式5描述合并层的输出。

$ $ \{对齐}开始W_{合并}= & {}W \ cdot \压裂{\伽马}{\√6{\σ^{2}+ \ε}}\{对齐}$ $
(3)
$ $ \{对齐}开始B_{合并}= & {}(B - \μ)\ cdot \压裂{\伽马}{\√6{\σ^{2}+ \ε}}\{对齐}$ $
(4)
$ $ \{对齐}开始Y = & {} W_{合并}\ cdot X + B_{合并}\{对齐}$ $
(5)

在合并过程中,对三维U-Net结构进行遍历,寻找相邻的卷积层和BN层。根据公式求得合并权值和偏差。3.4.然后由合并的卷积层代替原始卷积层和BN层。去卷积层的核心计算方程与卷积层的核心计算方程相同,因此上述合并方法对于BN层和碎屑层也是有效的。

量化网络参数

将BN层合并后,对网络参数进行量化。网络参数采用动态定点线性量化,量化结果为8位带符号定点数。对于权张量W,如某卷积层的权值,首先确定其最大值和最小值,然后计算比例因子,将该张量的所有值映射到一个8位有符号定点数的表示范围,即−128 ~ 127。为了便于FPGA进行缩放操作,将缩放因子限制为2的幂,通过移位操作来实现缩放操作。移位操作的位数的计算\ (b_s \)如式所示。6其中位宽\ (b_w \)是8,|W|是W的绝对值,装天花板马克斯分别为集合函数和最大值函数。

$$ \ begined {对齐} \ begin {senugented} b_s = b_w - 1 - ceil(log_2(max(\ vert w \ vert)))\ end {对齐} \ end {对齐} $$
(6)

在3D U-Net的量化过程中,分别计算每个3D卷积或碎屑层的重量和偏置尺度因子。

量化网络活动数据

网络活动数据是每层的输入和输出。它还使用动态定点线性量化,量化结果符号为8位定点数。使用少量校准数据来运行网络,然后确定每个层的输入和输出的最大值和最小值,最后根据每个层的输入和输出的移位操作的比特数进行计算到方程。6

动态定点线性量化的过程如下。首先,由于TensorFlow网络模型描述的精细粒度,量化不方便。该网络模型由PyTorch改写。其次,卷积/解卷积层被替换为相应的合并层。第三,网络设置为训练模式使用两个患者数据作为校准输入来运行的网络。该步骤可以计算每个量化层的输入和输出的最大绝对值。最后,每个量化层的量化函数被运行时执行的网络参数和网络活动数据量化的计算。量化网络结构和网络参数被生成。

量化层由量化装饰器等级INQ实现,其将其他操作添加到量化卷积和碎屑层的前向传播功能。计算训练模式中输入和输出数据的最大绝对值。在评估模式中,输入和输出数据是动态定点线性量化,以模拟运行量化网络的FPGA行为。量化装饰器类还定义了量化成员功能,以计算参数和活动数据中的换档操作的比特数,以及量化参数。

我们培养的3D掌中与亚当优化和交叉熵损失,0.001学习速率,2批量大小和30表的训练时代1描述了分割模型的学习超参数。然后在BraTS19和BraTS20上对原始网络和量化网络进行测试。评价模式设置为以测试数据作为输入运行网络向前,并计算像素精度评分(ACC)和骰子相似系数评分(DSC)。与量化前的网络相比,损耗几乎可以忽略不计。量化后的活动数据和参数为8位带符号的定点数字,可以减少存储资源,在PFGA硬件中有效实现。

表1分割模型的学习超参数

加速器架构和设计实现

数字4是拟议加速器的概述。包括指令控制器、偏置存储器、参数存储器、输入数据存储器、中间和输出数据存储器、输入接口、输出接口和处理元件(PE)阵列8个部分。指令控制器收到配置命令后,将命令保存到配置寄存器中,PE Array根据配置信息自动从Bias Memory、Parameter Memory和Input data Memory中读取数据。然后将计算结果写入中间输出数据存储器的就绪存储区。

图4
装具

基于FPGA的脑肿瘤分割加速器架构

由于在3D U形网,固定的输入和输出通道结构通向计算资源的利用率的减少的每一层中的输入和输出信道的数量的巨大差异。为了解决这个问题,有在所述可配置的PE结构3种计算模式。这些模式是4-32,32-32,32-64。当第一层的输入通道是小的,我们配置PE为4-32模式,其计算的4个输入通道和32个输出通道的特征地图上的4个像素。对于一些卷积层和解卷积层用32个输入通道和32个输出通道,我们配置PE为32-32模式来计算特征图的两个像素在一个时间。也有32-64模式,这是在输入信道32的层和所述输出信道使用的特征图的64.一个像素计算在一个时间。三种配置模式,让我们的FPGA加速器能够更好地利用计算资源,并尽量减少闲置乘法器的比例。

控制机制

MIPS CPU的每条指令的执行分为5个阶段:指令提取(如果)、指令解码(ID), 执行 (前女友)、内存存取(MEM.),并注册写回(白平衡).通常这5个阶段被做成一个5阶段的流水线,流水线的每一个阶段的执行都固定在1个时钟周期内,这样流水线就提高了处理速度。我们的加速器学习了CPU的方法,并将每个指令的执行分为4个阶段:配置(CF),加载数据(LD.),执行(前女友),回写(白平衡).因为这4个阶段所消耗的循环次数是不同的并且不是固定的,所以它不能像MIPS CPU那样形成一个管道。采用双缓冲策略,可以使周期最长的阶段掩盖其他阶段的时间。数字5A, b是没有双缓冲策略和在双缓冲策略下执行阶段的图表。在这种情况下前女友在双缓冲策略下,可以看出,当执行多个这样的指令时前女友舞台将掩盖大部分的运行时间CFLD., 和白平衡,大大减少了整体计算时间。类似地,如果LD.成为每个阶段最长的时间LD.舞台可以覆盖大部分的运行时间CF前女友白平衡

图5
figure5

一个在没有双缓冲策略的情况下执行每个阶段,b双缓冲策略下每个阶段的执行

分区和调度

目前的卷积神经网络加速器可分为两类。一种类型是多层计算,即,在完成层的块之后,获得该块的结果,然后执行下一层。该层的结果未写入片外存储器。另一个是计算层由层计算,这意味着在完成一层之后计算下一个层。结果未写入片外存储器。由于3D U-Net参数的数量比2D网络的数量高或甚至数百倍。第一种方法将有太多的片上参数。结果,选择逐层计算的第二种方法。如我们所知,FPGA计算和存储资源有限,必须将一层3D U-NET分为多个块。不同的分区结果对FPGA上CNN模型的执行效率产生不同的影响。 Constraints are set according to chip resources and other conditions to obtain partition result. According to the partition result, address allocation is performed on the input feature map of the first layer and the static data such as the weights and bias data of each layer.

在分别获得分区结果和数据地址之后,我们开始安排执行阶段。调度的目标是试图隐藏负载数据时间或计算块的计算时间,以提高执行管道的效率。首先,我们以层为单位,根据划分结果生成一系列计算块。该步骤将每一层的计算过程按一定顺序划分为若干计算块。其次,根据芯片的指令集配置规则和每个计算块的标签信息,生成二进制计算块序列的指令。最后,将二进制指令存储在外部存储器中,供设计的指令采集模块获取相关指令。

三维卷积的实现与优化

为了更方便地实现三维卷积,我们将三维转换为二维,以加快计算过程。例如,如图所示。6, 为一个3 \ \ (* 3 \ * 3 \)卷积核,深度方向分为三种不同\(3 \倍3 \)卷积核,通过对3个不同块的中间结果进行累加得到最终结果。这样,在不影响计算结果的情况下,通过2D硬件架构实现了3D卷积。

图6
figure6

三维卷积核转换为二维卷积核

在生成计算块序列的过程中,对某些层进行了具体的优化,以提高效率。例如,由于反卷积层的零填充操作,在三维U-Net中反卷积层的输出特征图中存在很多零。在反卷积层的下一层,可以跳过输入特征图全为零的计算块,提高计算效率,降低功耗。

结果

表2提出方法的性能
表3拟议方法比较

演出BraTS19和BraTS20数据集用于网络培训和测试。在BraTS19中,我们使用240个(HGG/LGG)案例进行培训,100个案例进行测试。在BraTS20中,260例(HGG/LGG)用于培训,109例用于测试。我们的方法的DSC、执行时间和能耗如表所示2.在BraTS19和BraTS20中,我们的FPGA方法实现了0.871 DSC和0.882 DSC。平均执行时间为0.15s, FPGA能耗为45W。

桌子3.是与最近的方法提供的比较,该方法也在BraTS数据集上进行测试。实验结果表明,该方法分割结果准确、有效。此外,与CPU或GPU解决方案相比,我们的FPGA方法还可以减少一半以上的功耗。

图7
figure7

CPU、GPU和FPGA的性能和能效比较

FPGA的,CPU和GPU设计的性能和能源效率进行了比较。测试单个图像的执行时间是偶然的,因为它太短,往往不够准确。因此,每第二测试图像的数量是通过测试在BraTS19和BraTS20数据集200个核磁共振分割任务以获得平均测量。性能由每秒处理(FPS)的图像的帧的数量测量,并且能量效率指的是性能和功率(FPS / MW)在计算过程中的比率。数字7比较了FPGA、CPU和GPU实现的性能和能效。可以看出,FPGA的性能比CPU高5.21倍,比GPU快44.47倍,能效比是GPU的11.22倍,是CPU的82.33倍。处理速度和能源效率都得到了极大的提高。

资源使用率我们的设计在U280卡上进行了测试。FPGA资源利用率如表所示4.由此可以看出,我们的FPGA设计中采用的存储和合理的计算资源。数字8是基于fpga设计的平面布置图,经过布置和布线。FPGA芯片内部有6个计算核。每一个都用不同的颜色标记。

表4 FPGA放置和路由后的资源利用率
图8
figure8

FPGA布局布线后的布局规划

讨论与未来工作

随着生活环境和医疗条件的发展,医疗保健已经变得更加关注。作为医生诊断和治疗的重要手段,医学图像已经普及。脑肿瘤分割作为医学图像处理的重要部分也引起了研究人员的注意。基于深度学习的脑肿瘤分割算法具有高精度和自动学习的特点,近年来突破了传统脑图像分割算法的局限性,成为近年来脑图像分割领域的热门研究课题。为了提高深度神经网络的性能,研究人员由于深神经网络模型中的大型计算和复杂存储问题而努力。GPU加速可以完成任务,但仍然可以提高速度。脑肿瘤分割的神经网络模型可以以硬件友好的方式简化,而不会影响模型的准确性。结果,FPGA设计可以实现比CPU和GPU更高的速度和能量效率。

虽然脑肿瘤分割任务正在加速,但仍有一些挑战有待于未来的工作。在研究过程中,我们发现脑肿瘤分割的医学图像具有相对较大的稀疏性,平均稀疏度为70\ \ % \ ().如果输入图像的稀疏特性可以用于算法或硬件实现以节省无效计算的时间,将实现更好的性能。

结论

脑肿瘤是最常见的肿瘤之一,具有高发病率、高复发、高死亡率的特点。脑肿瘤分割是鉴别潜在癌变组织的一种有效方法。但这增加了医生的负担,医生的地位和经验对分析结果有很大影响。因此,许多CAD系统被开发出来。在这些系统中,高精度脑肿瘤分割的第一步是后续治疗过程的关键。提出并实现了一种基于fpga的脑肿瘤分割推理加速器,可以提高分割速度,降低功耗。基于BraTS19和BraTS20的FPGA加速器的性能和功耗都优于传统的计算技术。平均速度是CPU和GPU的5.21倍和44.47倍。与CPU和GPU相比,能效分别提高了11.22倍和82.33倍。FPGA加速硬件的设计为脑肿瘤自动分割的改进提供了新的方向。

数据和材料的可用性

当前研究中分析的数据集来自brat,可在https://www.med.upenn.edu/cbica/brats-2019https://www.med.upenn.edu/cbica/brats2020

缩写

CPU:

中央处理单元

GPU:

图形处理单元

FPGA:

现场可编程门阵列

计算机辅助设计:

计算机辅助检测

支持向量机:

支持向量机

核磁共振成像:

磁共振成像

磁流变液:

马尔可夫随机场

美国有线电视新闻网:

卷积神经网络

RNN:

递归神经网络

参考文献

  1. 1。

    脑肿瘤MRI分割的最新进展。Magn Reson Imaging. 2013; 31:1426-38。

    文章谷歌学术搜索

  2. 2。

    艾哈迈德N,莱维Ĵ,任S,穆什塔克H,Bertels K,铝-ARS Z. GASAL2:一个GPU加速序列比对库进行高通量NGS数据。BMC生物素。2019; 20:520。

    文章谷歌学术搜索

  3. 3.

    阿万MG,DeslippeĴ,Buluc A,Selvitopi O,Hofmeyr S,Oliker L,Yelick K. ADEPT:用于GPU架构域独立序列对准策略。BMC生物素。2020; 21:1-29。

    文章谷歌学术搜索

  4. 4.

    Jin Z, Bakos JD。将BEAGLE库扩展到多fpga平台。14章25条的BMC Bioinform。2013;。

    文章谷歌学术搜索

  5. 5.

    Sanaullah A,Yang C,Alexeev Y,Yoshii K,Herbordt MC。使用FPGA加速神经网络的医学诊断实时数据分析。BMC生物素。2018; 19:490。

    文章谷歌学术搜索

  6. 6.

    Suzuki H,Toriwaki J.通过知识引导阈值自动分割头部MRI图像.计算机医学成像图.1991;15:233–40。

    中科院文章谷歌学术搜索

  7. 7.

    Salman YM, Assal MA, Badawi AM, Alian SM, El-Bayome ME-。脑肿瘤定量测量的验证技术。中国生物医学工程学报,2005;7048 - 7051。

  8. 8.

    Vijayakumar C, harpure DC。用于脑肿瘤MR图像自动分割的图像处理软件的开发。医学杂志2011;36:147-58。

    中科院文章谷歌学术搜索

  9. 9

    机器学习简介。伦敦:麻省理工学院出版社;2020.

    谷歌学术搜索

  10. 10。

    核磁共振图像非增强性脑肿瘤的自动分割。arif Intell Med. 2001; 21:43-63。

    中科院文章谷歌学术搜索

  11. 11.

    周俊,陈克强,庄伟,李志强。基于一类支持向量机的磁共振图像中脑肿瘤的提取。见:2005 IEEE工程医学与生物学第27届年会;2006.6411 - 14页。

  12. 12.

    关键词:GABOR, MRF,核磁共振成像,脑肿瘤医学图像计算和计算机辅助干预国际会议;2013.751 - 8页。

  13. 13。

    基于深度卷积神经网络的乳腺x线照相术中孤立性囊肿的鉴别。医学。2017;44:1017-27。

    中科院文章谷歌学术搜索

  14. 14。

    Cicero M,Bilbily A,Colak E,Dowdell T,Gray B,Perampaladas K,Barfett J.培训和验证深度卷积神经网络,用于计算机辅助检测和正面胸部射线照片的异常分类。Investig Radiol。2017; 52:281-7。

    文章谷歌学术搜索

  15. 15.

    Zikic D,Ioannou Y,Brown M,Criminisi A.用卷积神经网络分割脑肿瘤组织。参加:多模式脑肿瘤分割挑战MICCAI研讨会(BRATS);2014P36–39.

  16. 16.

    基于多尺度特征集成的深度三维卷积编码器网络在多发性硬化病灶分割中的应用。IEEE Trans Med Imaging. 2016; 35:1229-39。

    文章谷歌学术搜索

  17. 17.

    基于多路径CNN的脑肿瘤分割方法。国际MICCAI脑病研讨会;2017.403 - 22页。

  18. 18.

    Amin J,Sharif M,Raza M,Saba T,Anjum Ma。脑肿瘤检测使用统计和机器学习方法。计算方法生物化程序。2019年; 177:69-79。

    文章谷歌学术搜索

  19. 19.

    Sharif M, Amin J, Nisar MW, Anjum MA, Muhammad N, Shad SA。一种基于特征融合的统一补丁脑肿瘤检测方法。Cogn Syst Res. 2020; 59:273-86。

    文章谷歌学术搜索

  20. 20。

    Amin J,Sharif M,Anjum MA,Raza M,Bukhari SAC.利用MRI对胶质瘤和中风病变检测进行批量标准化的卷积神经网络。Cogn Syst Res.2020;59:304–11。

    文章谷歌学术搜索

  21. 21。

    Sharif M, Amin J, Raza M, Anjum MA, Afzal H, Shad SA。基于极限学习的脑肿瘤检测。中国计算机科学(英文版);

    谷歌学术搜索

  22. 22。

    吴志强,王志强,王志强。基于稀疏标注的三维立体分割算法。计算机应用与发展。医学图像计算和计算机辅助干预国际会议;2016.424 - 32页。

  23. 23。

    基于卷积网络的生物医学图像分割。医学图像计算和计算机辅助干预国际会议;2015.234 - 41页。

  24. 24。

    Menze BH,Jakab A,鲍尔S,Kalpathy-克拉默Ĵ,法拉哈尼K,柯比Ĵ,布伦Y,的Porz N,SlotboomĴ,威斯特R,等人。多峰脑瘤的图像分割基准(臭小子)。IEEE跨医学成像。2014; 34(10):1993年至2024年。

    文章谷歌学术搜索

  25. 25。

    Bakas S, Akbari H, Sotiras A, Bilello M, Rozycki M, Kirby JS, Freymann JB, Farahani K, Davatzikos C.利用专家分割标签和放射学特征推进癌症基因组图谱胶质瘤MRI收集。科学数据。2017;4(1):1-13。

    文章谷歌学术搜索

  26. 26。

    Bakas S,Reyes M,Jakab A,Bauer S,Rempfler M,CriCri A,Shinohara RT,Berger C,HA SM,Rozycki M等。识别脑肿瘤细分,进展评估以及Brats挑战中的总生存预测的最佳机器学习算法;2018. Arxiv预印刷品arXiv: 1811.02629

  27. 27.

    罗聪,曹伟,王丽,梁伯雄。RNA:用于量化和重构深度神经网络的精确残差网络加速器。IEICE Trans-Inf System.2019;102:1037–45。

    文章谷歌学术搜索

  28. 28.

    赵X,吴y,歌,李z,张y,风扇y。一种深入学习模型,整合FCNN和脑肿瘤细分的CRF。Med图像肛门。2018; 43:98-111。

    文章谷歌学术搜索

  29. 29.

    基于深度卷积神经网络的脑肿瘤检测大数据分析。未来通用计算机系统。2018;87:290-7。

    文章谷歌学术搜索

  30. 30.

    陈某,丁C,刘米双重卷积神经网络,用于准确脑肿瘤细分。模式识别。2019; 88:90-100。

    文章谷歌学术搜索

下载参考

确认

不适用。

资金

国家自然科学基金项目(no . 61971143);上海市科技重大专项(no . 2018SHZDZX01);上海市卫生健康委员会项目(no . 2018ZHYL0107)。

作者信息

隶属关系

作者

贡献

ZS, WC构思了这个项目。WC, XF, SX设计并实现了基于fpga的体系结构。GW、XZ完成量化工作。ZH完成了分区和调度过程。SX进行了分析并撰写了手稿。LW, JY, SD, ZS对原稿进行了严格的修改。所有作者都已阅读并批准了最终手稿。

相应的作者

对魏曹或志峰施的通信。

伦理宣言

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

两位作者宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

欧宝体育黑玩家施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

权利和权限

开放访问本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

重印和许可

关于这篇文章

通过交叉标记验证货币和真实性

引用这篇文章

熊胜,吴国栋,范旭东。et al。基于fpga加速神经网络的mri脑肿瘤分割。欧宝娱乐合法吗22,421(2021)。https://doi.org/10.1186/S12859-021-04347-6.

下载引用

关键字

  • 脑瘤segmatation
  • FPGA加速
  • 神经网络