]> git.ipfire.org Git - thirdparty/bird.git/blobdiff - proto/bgp/bgp.h
Merge branch 'master' into mq-filter-stack
[thirdparty/bird.git] / proto / bgp / bgp.h
index 3d940c22a36f7f2a1cef4ac87596ab8b32949387..075e1bb9c3bcf6672108f8a01b8e4f23f55350f3 100644 (file)
@@ -83,6 +83,7 @@ struct bgp_config {
   struct iface *iface;                 /* Interface for link-local addresses */
   u16 local_port;                      /* Local listening port */
   u16 remote_port;                     /* Neighbor destination port */
+  int peer_type;                       /* Internal or external BGP (BGP_PT_*, optional) */
   int multihop;                                /* Number of hops if multihop */
   int strict_bind;                     /* Bind listening socket to local address */
   int ttl_security;                    /* Enable TTL security [RFC 5082] */
@@ -107,9 +108,11 @@ struct bgp_config {
   int allow_local_as;                  /* Allow that number of local ASNs in incoming AS_PATHs */
   int allow_local_pref;                        /* Allow LOCAL_PREF in EBGP sessions */
   int gr_mode;                         /* Graceful restart mode (BGP_GR_*) */
+  int llgr_mode;                       /* Long-lived graceful restart mode (BGP_LLGR_*) */
   int setkey;                          /* Set MD5 password to system SA/SP database */
   /* Times below are in seconds */
   unsigned gr_time;                    /* Graceful restart timeout */
+  unsigned llgr_time;                  /* Long-lived graceful restart stale time */
   unsigned connect_delay_time;         /* Minimum delay between connect attempts */
   unsigned connect_retry_time;         /* Timeout for connect attempts */
   unsigned hold_time, initial_hold_time;
@@ -118,8 +121,12 @@ struct bgp_config {
   unsigned error_delay_time_min;       /* Time to wait after an error is detected */
   unsigned error_delay_time_max;
   unsigned disable_after_error;                /* Disable the protocol when error is detected */
+  u32 disable_after_cease;             /* Disable it when cease is received, bitfield */
 
   char *password;                      /* Password used for MD5 authentication */
+  net_addr *remote_range;              /* Allowed neighbor range for dynamic BGP */
+  char *dynamic_name;                  /* Name pattern for dynamic BGP */
+  int dynamic_name_digits;             /* Minimum number of digits for dynamic names */
   int check_link;                      /* Use iface link state for liveness detection */
   int bfd;                             /* Use BFD for liveness detection */
 };
@@ -131,26 +138,38 @@ struct bgp_channel_config {
   const struct bgp_af_desc *desc;
 
   ip_addr next_hop_addr;               /* Local address for NEXT_HOP attribute */
-  u8 next_hop_self;                    /* Always set next hop to local IP address */
-  u8 next_hop_keep;                    /* Do not touch next hop attribute */
+  u8 next_hop_self;                    /* Always set next hop to local IP address (NH_*) */
+  u8 next_hop_keep;                    /* Do not modify next hop attribute (NH_*) */
+  u8 mandatory;                                /* Channel is mandatory in capability negotiation */
   u8 missing_lladdr;                   /* What we will do when we don' know link-local addr, see MLL_* */
   u8 gw_mode;                          /* How we compute route gateway from next_hop attr, see GW_* */
   u8 secondary;                                /* Accept also non-best routes (i.e. RA_ACCEPTED) */
   u8 gr_able;                          /* Allow full graceful restart for the channel */
+  u8 llgr_able;                                /* Allow full long-lived GR for the channel */
+  uint llgr_time;                      /* Long-lived graceful restart stale time */
   u8 ext_next_hop;                     /* Allow both IPv4 and IPv6 next hops */
   u8 add_path;                         /* Use ADD-PATH extension [RFC 7911] */
+  u8 import_table;                     /* Use c.in_table as Adj-RIB-In */
 
   uint rest[0];                                /* Remaining items are reconfigured separately */
   struct rtable_config *igp_table_ip4; /* Table for recursive IPv4 next hop lookups */
   struct rtable_config *igp_table_ip6; /* Table for recursive IPv6 next hop lookups */
 };
 
-#define MLL_SELF 1
-#define MLL_DROP 2
-#define MLL_IGNORE 3
+#define BGP_PT_INTERNAL                1
+#define BGP_PT_EXTERNAL                2
 
-#define GW_DIRECT 1
-#define GW_RECURSIVE 2
+#define NH_NO                  0
+#define NH_ALL                 1
+#define NH_IBGP                        2
+#define NH_EBGP                        3
+
+#define MLL_SELF               1
+#define MLL_DROP               2
+#define MLL_IGNORE             3
+
+#define GW_DIRECT              1
+#define GW_RECURSIVE           2
 
 #define BGP_ADD_PATH_RX                1
 #define BGP_ADD_PATH_TX                2
@@ -165,12 +184,26 @@ struct bgp_channel_config {
 /* For GR capability per-AF flags */
 #define BGP_GRF_FORWARDING 0x80
 
+#define BGP_LLGR_ABLE          1
+#define BGP_LLGR_AWARE         2
+
+#define BGP_LLGRF_FORWARDING 0x80
+
+#define BGP_GRS_NONE           0       /* No GR  */
+#define BGP_GRS_ACTIVE         1       /* Graceful restart per RFC 4724 */
+#define BGP_GRS_LLGR           2       /* Long-lived GR phase (stale timer active) */
+
+#define BGP_BFD_GRACEFUL       2       /* BFD down triggers graceful restart */
+
 
 struct bgp_af_caps {
   u32 afi;
   u8 ready;                            /* Multiprotocol capability, RFC 4760 */
   u8 gr_able;                          /* Graceful restart support, RFC 4724 */
   u8 gr_af_flags;                      /* Graceful restart per-AF flags */
+  u8 llgr_able;                                /* Long-lived GR, RFC draft */
+  u32 llgr_time;                       /* Long-lived GR stale time */
+  u8 llgr_flags;                       /* Long-lived GR per-AF flags */
   u8 ext_next_hop;                     /* Extended IPv6 next hop,   RFC 5549 */
   u8 add_path;                         /* Multiple paths support,   RFC 7911 */
 };
@@ -187,7 +220,12 @@ struct bgp_caps {
   u8 gr_flags;                         /* Graceful restart flags */
   u16 gr_time;                         /* Graceful restart time in seconds */
 
+  u8 llgr_aware;                       /* Long-lived GR capability, RFC draft */
+  u8 any_ext_next_hop;                 /* Bitwise OR of per-AF ext_next_hop */
+  u8 any_add_path;                     /* Bitwise OR of per-AF add_path */
+
   u16 af_count;                                /* Number of af_data items */
+  u16 length;                          /* Length of capabilities in OPEN msg */
 
   struct bgp_af_caps af_data[0];       /* Per-AF capability data */
 };
@@ -208,6 +246,7 @@ struct bgp_conn {
   u8 state;                            /* State of connection state machine */
   u8 as4_session;                      /* Session uses 4B AS numbers in AS_PATH (both sides support it) */
   u8 ext_messages;                     /* Session uses extended message length */
+  u32 received_as;                     /* ASN received in OPEN message */
 
   struct bgp_caps *local_caps;
   struct bgp_caps *remote_caps;
@@ -227,23 +266,28 @@ struct bgp_conn {
 
 struct bgp_proto {
   struct proto p;
-  struct bgp_config *cf;               /* Shortcut to BGP configuration */
+  const struct bgp_config *cf;         /* Shortcut to BGP configuration */
+  ip_addr local_ip, remote_ip;
   u32 local_as, remote_as;
   u32 public_as;                       /* Externally visible ASN (local_as or confederation id) */
   u32 local_id;                                /* BGP identifier of this router */
   u32 remote_id;                       /* BGP identifier of the neighbor */
   u32 rr_cluster_id;                   /* Route reflector cluster ID */
-  int start_state;                     /* Substates that partitions BS_START */
+  u8 start_state;                      /* Substates that partitions BS_START */
   u8 is_internal;                      /* Internal BGP session (local_as == remote_as) */
   u8 is_interior;                      /* Internal or intra-confederation BGP session */
   u8 as4_session;                      /* Session uses 4B AS numbers in AS_PATH (both sides support it) */
   u8 rr_client;                                /* Whether neighbor is RR client of me */
   u8 rs_client;                                /* Whether neighbor is RS client of me */
+  u8 ipv4;                             /* Use IPv4 connection, i.e. remote_ip is IPv4 */
+  u8 passive;                          /* Do not initiate outgoing connection */
   u8 route_refresh;                    /* Route refresh allowed to send [RFC 2918] */
   u8 enhanced_refresh;                 /* Enhanced refresh is negotiated [RFC 7313] */
   u8 gr_ready;                         /* Neighbor could do graceful restart */
+  u8 llgr_ready;                       /* Neighbor could do Long-lived GR, implies gr_ready */
   u8 gr_active_num;                    /* Neighbor is doing GR, number of active channels */
   u8 channel_count;                    /* Number of active channels */
+  u8 summary_add_path_rx;              /* Summary state of ADD_PATH RX w.r.t active channels */
   u32 *afi_map;                                /* Map channel index -> AFI */
   struct bgp_channel **channel_map;    /* Map channel index -> channel */
   struct bgp_conn *conn;               /* Connection we have established */
@@ -253,11 +297,12 @@ struct bgp_proto {
   struct neighbor *neigh;              /* Neighbor entry corresponding to remote ip, NULL if multihop */
   struct bgp_socket *sock;             /* Shared listening socket */
   struct bfd_request *bfd_req;         /* BFD request, if BFD is used */
-  ip_addr source_addr;                 /* Local address used as an advertised next hop */
-  ip_addr link_addr;                   /* Link-local version of source_addr */
+  struct birdsock *postponed_sk;       /* Postponed incoming socket for dynamic BGP */
+  ip_addr link_addr;                   /* Link-local version of local_ip */
   event *event;                                /* Event for respawning and shutting process */
   timer *startup_timer;                        /* Timer used to delay protocol startup due to previous errors (startup_delay) */
   timer *gr_timer;                     /* Timer waiting for reestablishment after graceful restart */
+  int dynamic_name_counter;            /* Counter for dynamic BGP names */
   uint startup_delay;                  /* Delay (in seconds) of protocol startup due to previous errors */
   btime last_proto_error;              /* Time of last error that leads to protocol stop */
   u8 last_error_class;                         /* Error class of last error */
@@ -270,12 +315,16 @@ struct bgp_channel {
 
   /* Rest are BGP specific data */
   struct bgp_channel_config *cf;
-  pool *pool; /* XXXX */
 
   u32 afi;
   u32 index;
   const struct bgp_af_desc *desc;
 
+  rtable *igp_table_ip4;               /* Table for recursive IPv4 next hop lookups */
+  rtable *igp_table_ip6;               /* Table for recursive IPv6 next hop lookups */
+
+  /* Rest are zeroed when down */
+  pool *pool;
   HASH(struct bgp_bucket) bucket_hash; /* Hash table of route buckets */
   struct bgp_bucket *withdraw_bucket;  /* Withdrawn routes */
   list bucket_queue;                   /* Queue of buckets to send (struct bgp_bucket) */
@@ -283,17 +332,18 @@ struct bgp_channel {
   HASH(struct bgp_prefix) prefix_hash; /* Prefixes to be sent */
   slab *prefix_slab;                   /* Slab holding prefix nodes */
 
-  rtable *igp_table_ip4;               /* Table for recursive IPv4 next hop lookups */
-  rtable *igp_table_ip6;               /* Table for recursive IPv6 next hop lookups */
   ip_addr next_hop_addr;               /* Local address for NEXT_HOP attribute */
   ip_addr link_addr;                   /* Link-local version of next_hop_addr */
 
   u32 packets_to_send;                 /* Bitmap of packet types to be sent */
 
+  u8 ext_next_hop;                     /* Session allows both IPv4 and IPv6 next hops */
+
   u8 gr_ready;                         /* Neighbor could do GR on this AF */
-  u8 gr_active;                                /* Neighbor is doing GR and keeping fwd state */
+  u8 gr_active;                                /* Neighbor is doing GR (BGP_GRS_*) */
 
-  u8 ext_next_hop;                     /* Session allows both IPv4 and IPv6 next hops */
+  timer *stale_timer;                  /* Long-lived stale timer for LLGR */
+  u32 stale_time;                      /* Stored LLGR stale time from last session */
 
   u8 add_path_rx;                      /* Session expects receive of ADD-PATH extended NLRI */
   u8 add_path_tx;                      /* Session expects transmit of ADD-PATH extended NLRI */
@@ -336,12 +386,13 @@ struct bgp_write_state {
   struct bgp_channel *channel;
   struct linpool *pool;
 
+  int mp_reach;
   int as4_session;
   int add_path;
   int mpls;
 
   eattr *mp_next_hop;
-  adata *mpls_labels;
+  const adata *mpls_labels;
 };
 
 struct bgp_parse_state {
@@ -437,7 +488,7 @@ void bgp_graceful_restart_done(struct bgp_channel *c);
 void bgp_refresh_begin(struct bgp_channel *c);
 void bgp_refresh_end(struct bgp_channel *c);
 void bgp_store_error(struct bgp_proto *p, struct bgp_conn *c, u8 class, u32 code);
-void bgp_stop(struct bgp_proto *p, unsigned subcode);
+void bgp_stop(struct bgp_proto *p, int subcode, byte *data, uint len);
 
 struct rte_source *bgp_find_source(struct bgp_proto *p, u32 path_id);
 struct rte_source *bgp_get_source(struct bgp_proto *p, u32 path_id);
@@ -461,7 +512,7 @@ struct rte_source *bgp_get_source(struct bgp_proto *p, u32 path_id);
 static inline eattr *
 bgp_find_attr(ea_list *attrs, uint code)
 {
-  return ea_find(attrs, EA_CODE(EAP_BGP, code));
+  return ea_find(attrs, EA_CODE(PROTOCOL_BGP, code));
 }
 
 eattr *
@@ -472,7 +523,7 @@ bgp_set_attr_u32(ea_list **to, struct linpool *pool, uint code, uint flags, u32
 { bgp_set_attr(to, pool, code, flags, (uintptr_t) val); }
 
 static inline void
-bgp_set_attr_ptr(ea_list **to, struct linpool *pool, uint code, uint flags, struct adata *val)
+bgp_set_attr_ptr(ea_list **to, struct linpool *pool, uint code, uint flags, const struct adata *val)
 { bgp_set_attr(to, pool, code, flags, (uintptr_t) val); }
 
 static inline void
@@ -492,25 +543,29 @@ int bgp_encode_attrs(struct bgp_write_state *s, ea_list *attrs, byte *buf, byte
 ea_list * bgp_decode_attrs(struct bgp_parse_state *s, byte *data, uint len);
 
 void bgp_init_bucket_table(struct bgp_channel *c);
+void bgp_free_bucket_table(struct bgp_channel *c);
 void bgp_free_bucket(struct bgp_channel *c, struct bgp_bucket *b);
 void bgp_defer_bucket(struct bgp_channel *c, struct bgp_bucket *b);
 void bgp_withdraw_bucket(struct bgp_channel *c, struct bgp_bucket *b);
 
 void bgp_init_prefix_table(struct bgp_channel *c);
+void bgp_free_prefix_table(struct bgp_channel *c);
 void bgp_free_prefix(struct bgp_channel *c, struct bgp_prefix *bp);
 
 int bgp_rte_better(struct rte *, struct rte *);
 int bgp_rte_mergable(rte *pri, rte *sec);
 int bgp_rte_recalculate(rtable *table, net *net, rte *new, rte *old, rte *old_best);
-void bgp_rt_notify(struct proto *P, struct channel *C, net *n, rte *new, rte *old, ea_list *attrs);
-int bgp_import_control(struct proto *, struct rte **, struct ea_list **, struct linpool *);
+struct rte *bgp_rte_modify_stale(struct rte *r, struct linpool *pool);
+void bgp_rt_notify(struct proto *P, struct channel *C, net *n, rte *new, rte *old);
+int bgp_preexport(struct proto *, struct rte **, struct linpool *);
 int bgp_get_attr(struct eattr *e, byte *buf, int buflen);
-void bgp_get_route_info(struct rte *, byte *buf, struct ea_list *attrs);
+void bgp_get_route_info(struct rte *, byte *buf);
 
 
 /* packets.c */
 
-void mrt_dump_bgp_state_change(struct bgp_conn *conn, unsigned old, unsigned new);
+void bgp_dump_state_change(struct bgp_conn *conn, uint old, uint new);
+void bgp_prepare_capabilities(struct bgp_conn *conn);
 const struct bgp_af_desc *bgp_get_af_desc(u32 afi);
 const struct bgp_af_caps *bgp_find_af_caps(struct bgp_caps *caps, u32 afi);
 void bgp_schedule_packet(struct bgp_conn *conn, struct bgp_channel *c, int type);
@@ -642,6 +697,9 @@ void bgp_update_next_hop(struct bgp_export_state *s, eattr *a, ea_list **to);
 #define BGP_COMM_NO_ADVERTISE          0xffffff02      /* Don't export at all */
 #define BGP_COMM_NO_EXPORT_SUBCONFED   0xffffff03      /* NO_EXPORT even in local confederation */
 
+#define BGP_COMM_LLGR_STALE            0xffff0006      /* Route is stale according to LLGR */
+#define BGP_COMM_NO_LLGR               0xffff0007      /* Do not treat the route according to LLGR */
+
 /* Origins */
 
 #define ORIGIN_IGP             0