“接收 RSS”输入连接器可用于从简易资讯聚合 (RSS)、GeoRSS-Simple 或 GeoRSS GML 订阅源中检索数据。 RSS 没有的官方标准,但您可以从 w3schools.com、georss.org 和 ROME 中了解有关典型实施的详细信息,开源框架 ArcGIS GeoEvent Server 可用于解析 RSS 和 Atom 订阅源。
用法说明
使用“接收 RSS”输入连接器时,应记住以下事项:
- 此输入连接器将 RSS 入站适配器与 HTTP 入站传输进行配对。
- 使用此连接器可建立到 RSS 或 Atom 订阅源的 REST 端点的 HTTP 客户端连接,并定期轮询以检索数据。
- RSS 和 Atom 订阅源的内容通常组织为在渠道下分组的项目集合,如上图所示。
- RSS 和 Atom 订阅源的响应会经过解析,以从各个项目记录中提取数据;每个项目将作为单独的事件记录进行处理。
- 该连接器用于轮询数据的 HTTP 方法取决于 RSS 或 Atom 订阅源支持的请求类型。
- HTTP/GET 通常用于请求数据;连接器每次从订阅源请求数据时,都会建立一个客户端连接。
- 在参数参数中,可以使用查询参数帮助指定感兴趣的数据。
- 将查询参数指定为 HTTP/GET 请求的一部分,从而通过缩小返回的项目数来提高性能。
- 任何指定查询参数的名称和值均取决于外部 RSS 或 Atom 订阅源的 API 支持的请求。
- 仅接收新数据参数用于向源请求仅返回先前未发现的或新更新的数据。 此功能依赖于正确将“最后修改时间”合并到其 HTTP 请求响应的标头中的 RSS 或 Atom 订阅源。 如果响应标头未指示最后更新内容的日期和时间,GeoEvent Server 将假定响应中的数据表示新数据或最近更新的数据。 您可以在 RFC 7232 HTTP 规范中查看有关响应标头中“最后修改时间”使用的详细信息。
- 该连接器会创建并维护可更新其结构以反映 RSS 或 Atom 订阅源内容的 GeoEvent 定义。 GeoEvent 定义的名称根据订阅源内容中的标题改编。 GeoEvent Server 管理员不得配置多个内容不同但标题基本相同的“接收 RSS”输入。 输入每次轮询数据并接收响应时,可能会发现正在使用的 GeoEvent 定义已被其他已配置的输入更改,输入将会创建新的 GeoEvent 定义以适应其数据轮询。
注:
“接收 RSS”输入与类似标题之间的此类争用为已知限制。
参数
以下是“接收 RSS”输入连接器的参数:
参数 | 描述 |
---|---|
名称 | 用于在 GeoEvent Manager 中引用的输入连接器的描述性名称。 |
URL | 您希望用于轮询数据的 RSS 订阅源的基本 URL。 其中的一些应用示例包括: |
频率(以秒为单位) | 轮询 RSS 数据源以获取数据的间隔(以秒为单位)。 默认值为 10(即每 10 秒进行一次轮询请求)。 |
HTTP 方法 | 轮询提供数据源的外部服务器时要使用的 HTTP 请求方法 GeoEvent Server。 默认使用 HTTP/GET 请求。
|
参数 | 指定一个或多个要追加到基本 URL 的查询参数。 查询参数特定于每个 RSS 订阅源,并非受所有订阅源支持。 当受 RSS 订阅源支持时,查询参数有助于指定感兴趣的数据。 查询参数通常包含在 RSS 订阅源的 URL 中。 此参数没有默认值。 |
可接受的 MIME 类型(客户端模式) (条件分析) | 指定此连接器在接收其对数据源的查询的响应时将接受的 MIME 类型。 外部 Web 服务的响应指定发送到 GeoEvent Server 的任何数据的实际 MIME 类型。 此连接器解析以下 MIME 类型,这些类型是此参数的默认值: text/xml,application/rss+xml,application/atom+xml,application/xml,text/plain 有关官方 MIME 类型的详细信息,请参阅互联网地址编码分配机构 (IANA)。 有关 ArcGIS Server 未使用的 MIME 类型的详细信息,请参阅 ArcGIS Server 未使用的 MIME 类型。 此参数在 HTTP 方法设置为 Get 时显示,设置为 Post 或 Put 时隐藏。 |
仅接收新数据 | 指定适配器是否在数据源响应的标头中查找最近修改值,并尝试使用此值来避免处理已接收且未更新的数据。 此参数的名称可能具有误导性。 传输将始终接收数据源在其对连接器查询的响应中包含的任何数据。 但是,指定仅接收新数据时,传输将缓存其上次请求的日期/时间,并且仅在来自数据源的响应包含的最近修改值大于传输的缓存值时才会将收到的数据转发到适配器。 指定最近修改值为可选功能。 实际上,没有多少数据源在其响应中包含该值。 此参数的默认值为是,但是如果未找到最近修改值,则此参数会被忽略,因为确定响应中的数据是新数据还是更新数据所需的日期/时间不可用。
有关在响应标头中使用最近修改的详细信息,请参阅 RFC 7232 HTTP 规范。 |
使用 URL 代理 | 指定 GeoEvent Server 是否在发出 HTTP 请求时使用 URL 代理。 默认为否。
|
URL 代理 (条件分析) | 发出 HTTP 请求时使用的 URL 代理。 此参数在使用 URL 代理设置为是时显示,设置为否时隐藏。 |
HTTP 超时(秒) | 指定输入连接器等待来自托管 RSS 源的服务器的响应的最长时间(以秒为单位)。 该值必须是介于 1 到 2147483 之间的整数。 默认值为30(如果没有收到响应,30 秒后,HTTP 请求将超时)。 |